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Prefacio a la 

CUARTA EDICIÓN 


Esta nueva edición contiene ejemplos nuevos, 130 figuras nuevas y resultados obtenidos empleando cinco paquetes de 
software representativos de los cientos o quizá miles de paquetes de software usados en estadística. Todas las figuras 
de la tercera edición han sido sustituidas por figuras nuevas, un poco diferentes, creadas empleando estos cinco paque¬ 
tes de software: EXCEL, MINITAB, SAS, SPSS y STATISTIX. Los ejemplos tienen una gran influencia de USA Today, 
pues este periódico es una gran fuente de temas y ejemplos actuales de la estadística. 

Otros de los cambios que se encontrarán en esta edición son: el capítulo 18 sobre análisis de serie de tiempos fue 
eliminado y el capítulo 19 sobre control estadístico de procesos y capacidad de procesos se convirtieron en el capítulo 
18. Las respuestas a los ejercicios complementarios, al final de cada capítulo, se presentan ahora con más detalle. En 
todo el libro se analizan y emplean más los valores p. 

RECONOCIMIENTOS 

Dado que el software para estadística es muy importante en este libro, quiero agradecer a las personas y empresas 
siguientes por permitirme usar su software. 

MINITAB: Laura Brown, coordinadora del Programa de Ayuda a los Autores, Minitab, Inc., 1829 Pine Hall Road, 
State College, PA 16801. Yo soy miembro del programa de ayuda a los autores que practica Minitab, Inc. “Partes de 
los datos y de los resultados que se encuentran en esta publicación/libro han sido impresas con la autorización de 
Minitab, Inc. Todo este material, así como los derechos de autor, son propiedad exclusiva de Minitab, Inc.” La dirección 
de Minitab en la red es www.minitab.com. 

SAS: Sandy Varner, directora de operaciones de mercadotecnia, SAS Publishing, Cary, NC. “Creado con el software 
SAS. Copyright 2006. SAS Institute Inc., Cary, NC.” Se cita de su sitio en la red: “SAS es el líder en servicios y soft¬ 
ware inteligente para negocios. A lo largo de sus 30 años, SAS ha crecido —de siete empleados a casi 10 000 en todo 
el mundo, de unos cuantos clientes a más de 40 000— y todos estos años ha sido rentable”. La dirección en la red de 
SAS es www.sas.com. 

SPSS: Jill Rietema, gerente de cuenta. Publicaciones, SPSS. Se cita de su sitio en la red: “SPSS Inc. es líder como 
proveedor mundial de soluciones y software para análisis predictivo. Lundada en 1968, actualmente SPSS tiene más 
de 250 000 clientes en todo el mundo, atendidos por más de 1 200 empleados en 60 países.” La dirección en la Red de 
SPSS es www.spss.com. 

STATISTIX: Dr. Gerard Nimis, presidente, Analytical Software, PO. Box (apartado postal) 12185, Tallahassee, LL 
32317. Se toma de su sitio en la red: “Si se tiene que analizar datos y se es un investigador, pero no un especialista en 
estadística, STATISTIX está diseñado para ello. No necesitará programar ni usar un manual. Este software fácil de 
aprender y de usar ahorrará valioso tiempo y dinero. STATISTIX combina, en un solo y económico paquete, la esta- 
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dística, tanto básica como avanzada, con las poderosas herramientas para la manipulación de datos que se necesitan.” 
La dirección en la Red de Statistix es www.statistix.com. 

EXCEL: Se cuenta con Excel, de Microsoft, desde 1985. Cuentan con él casi todos los estudiantes universitarios. En 
este libro se emplea ampliamente. 

Deseo dar las gracias a Stanley Wileman por la asesoría informática desinteresada que me proporcionó en la crea¬ 
ción de este libro. Quiero agradecer a mi esposa, Lana, por su comprensión durante los días que dediqué a pensar en 
la mejor manera de presentar algunos conceptos. Mi agradecimiento a Chuck Wall, Sénior Adquisitions Editor, y a su 
equipo de McGraw-Hill. Por último, quiero dar las gracias a Jeremy Toynbee, director de proyecto en Keyword 
Publishing Services Ltd., Londres, Inglaterra, y a John Omiston, copy editor independiente, por su excelente trabajo 
de producción. 

Larry J. Stephens 
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TERCERA EDICIÓN 


Al preparar esta tercera edición de Estadística, Serie Schaum, he reemplazado problemas antiguos por problemas que 
reflejan los cambios tecnológicos y sociológicos ocurridos desde que se publicó la primera edición en 1961. Por ejem¬ 
plo, uno de los problemas en la segunda edición trata del tiempo de vida de los bulbos de radio. Como la mayoría de 
las personas menores de treinta años probablemente no sepan lo que es un bulbo de radio, este problema, lo mismo 
que muchos otros, fue sustituido por ejercicios que se refieren a temas actuales como el cuidado de la salud, el sida, 
Intenet, los teléfonos celulares, entre otros. Los asuntos matemáticos y estadísticos no han cambiado, sólo lo hicieron 
las áreas de aplicación y los aspectos de cálculo en estadística. 

Otra mejora es la introducción en el texto de software para estadística. El desarrollo de software para estadística, 
como SAS, SPSS y Minitab, ha variado drásticamente las aplicaciones de la estadística a problemas de la vida real. El 
software para estadística más utilizado, tanto en el medio académico como en el industrial, es el Minitab. Quiero agra¬ 
decer a Minitab Inc., por haberme otorgado el permiso para incluir, a lo largo de todo el libro, los resultados de Minitab. 
Muchos de los textos modernos de estadística traen, como parte del libro, resultados de algún paquete de software para 
estadística. En esta obra decidí emplear Minitab, ya que es muy utilizado y porque es muy amigable. 

Una vez que el estudiante aprende las diversas estructuras de archivos de datos necesarios para utilizar Minitab, así 
como la estructura de comandos y subcomandos, puede transferir con facilidad ese conocimiento a otros paquetes de 
software para estadística. Gracias a la introducción de menús como las cajas de diálogo, el software resulta muy ami¬ 
gable. La obra adiciona tanto los menús como las cajas de diálogo que presenta Minitab. En muchos de los problemas 
nuevos se discute el importante concepto de pruebas estadísticas. Cuando se publicó la primera edición, en 1961, el 
valor p no se utilizaba tan ampliamente como ahora, debido a que con frecuencia resulta difícil determinarlo sin la 
ayuda de un software. En la actualidad, el software para estadística da el valor p de manera rutinaria, puesto que, con 
este apoyo, su cálculo es a menudo un asunto trivial. 

Un nuevo capítulo titulado “Control estadístico de procesos y capacidad de procesos” reemplazó al capítulo 19, 
“Números índices”. Estos temas tienen gran aplicación industrial, por lo que se agregaron al libro. La inclusión, en 
los paquetes de software modernos, de técnicas de control estadístico de procesos y capacidad de procesos ha facili¬ 
tado su utilización en nuevos campos industriales. El software lleva a cabo todos los cálculos, que son bastante 
laboriosos. 

Quiero agradecer a mi esposa Lana por su comprensión durante la preparación de este libro; a mi amigo Stanley 
Wileman, por la ayuda computacional que me brindó; y a Alan Hunt y su equipo de Keyword Publishing Service, en 
Londres, por su minusioso trabajo de producción. Por último quiero agradecer al equipo de McGraw-Hill por su coope¬ 
ración y ayuda. 

Larry J. Stephens 
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La estadística, o los métodos estadísticos, como se llaman algunas veces, desempeñan un papel cada vez más impor¬ 
tante en casi todas las áreas del quehacer humano. Aunque en un principio tenía que ver solamente con asuntos de 
Estado, a lo que debe su nombre, en la actualidad la influencia de la estadística se ha extendido a la agricultura, la 
biología, el comercio, la química, la comunicación, la economía, la educación, la electrónica, la medicina, la física, las 
ciencias políticas, la psicología, la sociología y a muchos otros campos de la ciencia y la ingeniería. 

El propósito de esta obra es presentar una introducción a los principios generales de la estadística, que será útil a 
todos los individuos sin importar su campo de especialización. Se diseñó para usarse ya sea como consulta para todos 
los textos estándar modernos o como un libro para un curso formal de estadística. Será también de gran valor como 
referencia para todos aquellos que estén aplicando la estadística en su campo de investigación particular. 

Cada capítulo empieza con una presentación clara de las definiciones correspondientes, los teoremas y principios, 
junto con algunos materiales ilustrativos y descriptivos. A esto le sigue un conjunto de problemas resueltos y comple¬ 
mentarios, que en muchos casos usan datos de situaciones estadísticas reales. Los problemas resueltos sirven para 
ilustrar y ampliar la teoría, hacen énfasis en aquellos pequeños puntos importantes sin los cuales el estudiante se sen¬ 
tiría continuamente inseguro; además, proporciona una repetición de los principios básicos, aspecto que es vital para 
una enseñanza eficiente. En los problemas resueltos se incluyen numerosas deducciones de fórmulas. La cantidad de 
problemas complementarios con respuestas constituyen una revisión completa del material de cada capítulo. 

Los únicos conocimientos matemáticos necesarios para la comprensión de todo el libro son la aritmética y el álge¬ 
bra elemental. En el capítulo 1 viene una revisión de los conceptos matemáticos importantes, que se pueden leer al 
principio del curso o después, cuando la necesidad se presente. 

Los primeros capítulos se ocupan del análisis de las distribuciones de frecuencia y de las correspondientes medidas 
de tendencia central, dispersión, sesgo y curtosis. Lo anterior lleva, de manera natural, a una discusión de la teoría de 
probabilidad elemental y sus aplicaciones, lo que prepara el camino para el estudio de la teoría del muestreo. De entra¬ 
da, se abordan las técnicas de las muestras grandes, que comprenden la distribución normal, así como las aplicaciones 
a la estimación estadística y las pruebas de hipótesis y de significancia. La teoría de las muestras pequeñas, que com¬ 
prende la distribución t de Student, la distribución ji cuadrada y la distribución F, junto con sus aplicaciones, aparecen 
en un capítulo posterior. Otro capítulo sobre ajuste de curvas y el método de mínimos cuadrados lleva, de manera 
lógica, a los temas de correlación y regresión que involucran dos variables. La correlación múltiple y la parcial, que 
involucran más de dos variables, son tratadas en un capítulo aparte. A este tema le siguen capítulos sobre el análisis de 
varianza y métodos no paramétricos, que son nuevos en esta segunda edición. Dos capítulos finales tratan de series de 
tiempo y número índice, en ese orden. Además, se ha incluido más material del que se alcanza a cubrir en un primer 
curso. El objetivo es hacer el libro más flexible para proporcionar una obra de referencia más útil y estimular un pos¬ 
terior interés en estos temas. La obra permite cambiar el orden de muchos de los últimos capítulos u omitir algunos sin 
dificultad. Por ejemplo, los capítulos 13 a 15 y 18 y 19 pueden ser introducidos, en su mayor parte, inmediatamente 
después del capítulo 5, si se desea tratar correlación, regresión, series de tiempo y números índice antes de la teoría del 
muestreo. De igual manera, dejar de lado la mayor parte del capítulo 6, si no se desea dedicar mucho tiempo a proba¬ 
bilidad. En un primer curso, en ocasiones el capítulo 15 se ignora en su totalidad. El orden se plantea debido a que en 
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los cursos modernos hay una tendencia creciente a introducir teoría del muestreo y la inferencia estadística tan pronto 
como sea posible. 

Quiero agradecer a varias instituciones, tanto públicas como privadas, su cooperación al proporcionar datos para 
tablas. A lo largo del libro se dan las referencias apropiadas para esas fuentes. En particular, agradezco al profesor sir 
Roland A. Fisher, F.R.S., Cambrige; al doctor Frank Yates, F.R.S., Rothamster; y a Messrs. Oliver and Bond Ftd., 
Ediburgh, por haber otorgado el permiso para utilizar los datos de la tabla III de su libro Statistical Tablesfor Biological, 
Agricultural, and Medical Research. También quiero agradecer a Esther y a Meyer Scher, su apoyo, y al equipo de 
McGraw-Hill, su cooperación. 
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y GRÁFICAS 


ESTADÍSTICA 

La estadística se ocupa de los métodos científicos que se utilizan para recolectar, organizar, resumir, presentar y ana¬ 
lizar datos así como para obtener conclusiones válidas y tomar decisiones razonables con base en este análisis. 

El término estadística también se usa para denotar los datos o los números que se obtienen de esos datos; por 
ejemplo, los promedios. Así, se habla de estadísticas de empleo, estadísticas de accidentes, etcétera. 

POBLACIÓN Y MUESTRA; ESTADÍSTICA INDUCTIVA 
(O INFERENCIAL)Y ESTADÍSTICA DESCRIPTIVA 

Cuando se recolectan datos sobre las características de un grupo de individuos o de objetos, por ejemplo, estatura y 
peso de los estudiantes de una universidad o cantidad de pernos defectuosos y no defectuosos producidos en determi¬ 
nado día en una fábrica, suele ser imposible o poco práctico observar todo el grupo, en especial si se trata de un grupo 
grande. En vez de examinar todo el grupo, al que se le conoce como población o universo, se examina sólo una peque¬ 
ña parte del grupo, al que se le llama muestra. 

Las poblaciones pueden ser finitas o infinitas. Por ejemplo, la población que consta de todos los pernos producidos 
determinado día en una fábrica es finita, en tanto que la población que consta de todos los resultados (cara o cruz) que 
se pueden obtener lanzando una y otra vez una moneda es infinita. 

Si la muestra es representativa de la población, el análisis de la muestra permite inferir conclusiones válidas acerca 
de la población. A la parte de la estadística que se ocupa de las condiciones bajo la cuales tales inferencias son válidas 
se le llama estadística inductiva o inferenciaI. Como estas inferencias no pueden ser absolutamente ciertas, para pre¬ 
sentar estas conclusiones se emplea el lenguaje de la probabilidad. 

A la parte de la estadística que únicamente trata de describir y analizar un grupo dado, sin sacar ninguna conclusión 
ni hacer inferencia alguna acerca de un grupo más grande, se le conoce como estadística descriptiva o deductiva. 
Antes de proceder al estudio de la estadística, se analizarán algunos conceptos matemáticos importantes. 

VARIABLES: DISCRETAS Y CONTINUAS 

Una variable es un símbolo; por ejemplo, X, Y,H,xoB, que puede tomar cualquiera de los valores de determinado con¬ 
junto al que se le conoce como dominio de la variable. A una variable que sólo puede tomar un valor se le llama cons¬ 
tante. 

U na variable que puede tomar cualquiera de los valores entre dos números dados es una variable continua; de lo 
contrario es una variable discreta. 

EJEMPLO 1 La cantidad N de hijos que tiene una familia puede tomar los valores 0,1, 2, 3,..., pero no puede tomar valores 
como 2.5 o 3.842; ésta es una variable discreta. 
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EJEMPLO 2 La estatura H de una persona que puede ser 62 pulgadas (in), 63.8 in o 65.8341 ¡n, dependiendo de la exactitud con 
que se mida, es una variable continua. 

Los datos descritos mediante una variable discreta son datos discretos y los datos descritos mediante una variable 
continua son datos continuos. U n ejemplo de datos discretos es la cantidad de hijos que tiene cada una de 1 000 fami¬ 
lias, en tanto que un ejemplo de datos continuos son las estaturas de 100 estudiantes universitarios. En general, una 
medición proporciona datos continuos; en cambio, una enumeración o un conteo proporciona datos discretos. 

Es útil ampliar el concepto de variable a entidades no numéricas; por ejemplo, en el arco iris, color C es una varia¬ 
ble que puede tomar los "valores" rojo, anaranjado, amarillo, verde, azul, índigo o violeta. Estas variables se pueden 
reemplazar por números; por ejemplo, se puede denotar rojo con 1, anaranjado con 2, etcétera. 

REDONDEO DE CANTIDADES NUMÉRICAS 

El resultado de redondear un número por ejemplo 72.8 a la unidad más cercana es 73 debido a que 72.8 está más cerca 
de 73 que de 72. De igual manera, 72.8146 redondeado a la centési ma más cercana (o a dos I ugares decimales) es 72.81, 
ya que 72.8146 está más cerca de 72.81 que de 72.82. 

Sin embargo, para redondear 72.465 a la centésima más cercana, ocurre un dilema debido a que 72.465 se encuen¬ 
tra precisamente a la mitad entre 72.46 y 72.47. E n estos casos, lo que se acostumbra hacer es redondear al entero par 
antes del 5. Así, 72.465 se redondea a 72.46,183.575 se redondea a 183.58 y 116 500 000, redondeado al millón más 
cercano, es 116 000 000. Hacer esto es especialmente útil cuando se realiza una gran cantidad de operaciones para 
minimizar, así, el error de redondeo acumulado (ver problema 1.4). 

NOTACIÓN CIENTÍFICA 

Al escribir números, en especial aquellos en los que hay muchos ceros antes o después del punto decimal, es conve¬ 
niente usar la notación científica empleando potencias de 10. 

EJEMPLO 3 10 1 = 10,10 2 = 10 x 10 = 100,10 5 = 10 x 10 x 10 x 10 x 10 = 100 000 y 10 8 = 100 000 000. 

EJEMPLO 4 10° = 1,10” 1 = .1 o 0.1; 10“ 2 = .01 o 0.01; y 10~ 5 = .00001 o 0.00001. 

EJEMPLO 5 864 000 000 = 8.64 x 10 8 y 0.00003416 = 3.416 x 10- 5 . 

Obsérvese que el efecto de multiplicar un número, por ejemplo, por 10 8 , es recorrer el punto decimal del número 
ocho lugares a la derecha. El efecto de multiplicar un número por 1CT 6 es recorrer el punto decimal del número seis 
lugares a la izquierda. 

Con frecuencia, para hacer énfasis en que no se ha omitido un número distinto de cero antes del punto decimal, se 
escribe 0.1253 en lugar de .1253. Sin embargo, en casos en los que no pueda haber lugar a confusión, como en tablas, 
el cero antes del punto decimal puede omitirse. 

Para Indicar la multiplicación dedos o más números se acostumbra usar paréntesis o puntos. Así (5)(3) = 5 • 3 = 
5 x 3 = 15, y (10)(10)(10) = 10 ■ 10 ■ 10 = 10 x 10 x 10 = 1 000. Cuando se utilizan letras para representar núme¬ 
ros suelen omitirse los paréntesis y los puntos; por ejemplo, ab = (a)(b) = a ■ b =a x b. 

La notación científica es útil al hacer cálculos, en especial para localizar el punto decimal. Entonces se hace uso de 
las reglas siguientes: 

]O p 

(io p )( ío 9 ) = \o p+q — = \o p ~ q 

donde p y q son números cualesquiera. 

En 10 p , p es el exponente y 10 es la base. 


Cálculos 3 


EJEMPLO 6 (10 3 )(10 2 ) = 1 000 x 100 = 100 000 = 10 5 es decir, 10 3+2 


l(f 1 000 000 


= 100 = 10 2 es decir, 10 6-4 


10 4 10 000 


EJEMPLO 7 (4 000 000)(0.0000000002) = (4 x 10 6 )(2 x 10~ 10 ) = (4)(2)(10 6 )(10~ 10 ) = 8 x 10 6 ^ 10 


= 8 x 10 = 0.0008 


EJEMPLO 8 


(0.006)(80 000) _ (6 x 10" 3 )(8 x 10 4 ) _ 48 x 10 1 
004 ~ 4 x 10- 2 “ 4 x 10- 2 

= 12 x 10 3 = 12 0 00 



CIFRAS SIGNIFICATIVAS 

Si se anota la estatura de una persona como 65.4 in, esto significa que la estatura verdadera estará entre 65.35 y 65.45 
in. Los dígitos exactos, fuera de los ceros necesarios para localizar el punto decimal, son los dígitos significativos o 
cifras significativas del número. 

EJEMPLO 9 65.4 tiene tres cifras significativas. 

EJEMPLO 10 4.5300 tiene cinco cifras significativas. 

EJEMPLO 11 .0018 = 0.0018 = 1.8 x 10~ 3 tiene dos cifras significativas. 

EJEMPLO 12 .001800 = 0.001800 = 1.800 x 10~ 3 tiene cuatro cifras significativas. 

Los números obtenidos de enumeraciones (o conteos), a diferencia de los obtenidos de mediciones, por supuesto 
son exactos y por lo tanto tienen un número ilimitado de cifras significativas. Sin embargo, en algunos de estos casos 
puede ser difícil decidir, sin más información, cuáles cifras son significativas. Por ejemplo, el número 186 000 000 
puede tener 3, 4,..., 9 cifras significativas. Si se sabe que tiene cinco cifras significativas puede ser más adecuado 
escribirlo como 186.00 millones o como 1.8600 x 10 8 . 

CÁLCULOS 

Al realizar cálculos en los que intervienen multiplicaciones, divisioneso raíces de números, el resultado final no puede 
tener más cifras significativas que el número con menos cifras significativas (ver problema 1.9). 

EJEMPLO 13 73.24 x 4.53 = (73.24)(4.52) = 331 

EJEMPLO 14 1.648/0.023 = 72 

EJEMPLO 15 V38/7 = 6.22 

EJEMPLO 16 (8.416)(50) = 420.8 (si 50 es exacto) 

Cuando se suman o restan números, el resultado final no puede tener más cifras significativas después del punto 
decimal que los números con menos cifras significativas después del punto decimal (ver problema 1.10). 


EJEMPLO 17 3.16 + 2.7 = 5.9 
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EJEMPLO 18 83.42 - 72 = 11 

EJEMPLO 19 47.816 - 25 = 22.816 (si 25 es exacto) 

La regla anterior para la suma y la resta puede extenderse (ver problema 1.11). 

FUNCIONES 

Si a cada valor que puede tomar la variable X le corresponde un valor de una variable y, se dice que y es función deX 
y se escribe Y = F (X) (se lee “Y es Igual a F deX ") para Indicar esta dependencia funcional. En lugar deF también 
pueden usarse otras letras (G, </>, etcétera). 

La vari able X es la variable independiente y la variable y es la variable dependiente. 

SI a cada valor deX le corresponde únicamente un valor de y, se dice que y es una función univaluada deX; délo 
contrario, se dice que es una función multivaluada deX. 

EJEMPLO 20 La población P de Estados U nidos es función del tiempo t, lo que se escribe P =F(t). 

EJEMPLO 21 El estiramiento S de un resorte vertical es función del peso 1/1/ que hay en el extremo del resorte, es decir, 

S = G(W). 

La dependencia (o correspondencia) funcional entre vari ables puede describirse mediante una tabla. Pero también 
puede indicarse mediante una ecuación que relaciona las variables, por ejemplo, Y = 2X - 3, a partir de la cual puede 
determinarse el valor de y que corresponde a los diversos valores deX. 

Si y = F (X), F (3) denota "el valor de Y cuando X = 3", F (10) denota "el valor de Y cuando X = 10", etc. A sí, si 

y = F (X) =X 2 , entonces, F (3) = 3 2 = 9 es el valor de y cuando X = 3. 

El concepto defunción puede ampliarse a dos o más variables (ver problema 1.17). 

COORDENADAS RECTANGULARES 

En la figura 1-1 se muestra un diagrama de dispersión de EXCEL con cuatro puntos. Este diagrama de dispersión está 
formado por dos rectas mutuamente perpendiculares llamadas ejes X y y. El ejeX es horizontal y el eje y es vertical. 
Estos dos ejes se cortan en un punto llamado origen. Estas dos rectas dividen al plano XY en cuatro regiones que se 
denotan I, II, II y IV, a las que se les conoce como primero, segundo, tercero y cuarto cuadrantes. En la figura 1-1 se 
muestran cuatro puntos. El punto (2, 3) está en el primer cuadrante y se gráfica avanzando, desde el origen, 2 unidades 
a la derecha sobre el ejeX y desde ahí, 3 unidades hacia arriba. El punto (-2.3, 4.5) está en el segundo cuadrante y se 
gráfica avanzando, desde el origen, 2.3 unidades a la Izquierda sobre el ejeX y desde ahí, 4.5 unidades hacia arriba. El 
punto (-4, -3) está en el tercer cuadrante y se gráfica avanzando, desde el origen, 4 unidades a la Izquierda sobre el 
ejeX, y desde ahí 3 unidades hacia abajo. El punto (3.5, -4) está en el cuarto cuadrante y se gráfica avanzando 3.5 
unidades a la derecha sobre el ejeX, y desde ahí 4 unidades hacia abajo. El primer número de cada uno de estos pares 
es la abscisa del punto y el segundo número es la ordenada del punto. La abscisa y la ordenada, juntas, son las coor¬ 
denadas del punto. 

Las ¡deas anteriores pueden ampliarse construyendo un ejeZ a través del origen y perpendicular al plano XY. En 
este caso las coordenadas de cada punto se denotan (X, Y, Z). 

GRÁFICAS 

Una gráfica es una representación visual de la relación éntrelas variables. En estadística, dependiendo déla naturale¬ 
za de los datos y del propósito que se persiga, se emplean distintos tipos de gráficas: gráficas de barras, de pastel, 
pictogramas, etc. A las gráficas también se les suele llamar cartas o diagramas. Así, se habla de cartas de barras, 
diagramas de pastel, etc. (ver los problemas 1.23,1.24,1.25,1.26 y 1.27). 


Desigualdades 5 
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Figura 1-1 EXCEL, gráfica de puntos en los cuatro cuadrantes. 


ECUACIONES 

Las ecuaciones son expresiones de la forma A = B, donde A es el miembro (o lado) izquierdo de la ecuación y B es el 
miembro (o lado) derecho. SI se api ¡can las mismas operaciones a ambos lados de una ecuación se obtienen ecuaciones 
equivalentes. Así, si a ambos miembros de una ecuación se suma o resta un mismo número se obtiene una ecuación 
equivalente; también, si ambos lados se multiplican por un mismo número o se dividen entre un mismo número, con 
excepción de la división entre cero que no es válida, se obtiene una ecuación equivalente. 

EJEMPLO 22 Dada la ecuación 2X + 3 = 9, se resta 3 a ambos miembros: 2X + 3 - 3 = 9 - 3 o 2X = 6. Se dividen ambos 

miembros entre 2: 2X/2 = 6/2 oX = 3. Este valor deX es una solución de la ecuación dada, como se puede ver sustituyendo X por 

3, con lo que se obtiene 2(3) + 3 = 9, o 9 = 9, que es una identidad. AI proceso de obtener las soluciones de una ecuación se le 
conoce como resolver la ecuación. 

L as ideas anteriores pueden extenderse a hallar soluciones de dos ecuaciones en dos incógnitas, de tres ecuaciones 
en tres incógnitas, etc. A tales ecuaciones se les conoce como ecuaciones simultáneas (ver problema 1.30). 

DESIGUALDADES 

Los símbolos < y > significan "menor que" y "mayor que”, respectivamente. Los símbolos < y > significan "menor 
o igual a" y “mayor o igual a", respectivamente. Todos estos símbolos se conocen como signos de desigualdad. 

EJEMPLO 23 3 < 5 se lee "3 es menor que 5". 

EJEMPLO 24 5 > 3 se lee "5 es mayor que 3". 

EJEMPLO 25 X < 8 se lee "X es menor que 8". 
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EJEMPLO 26 X > 10 se lee "X es mayor o igual a 10". 

EJEMPLO 27 4 < Y < 6 se lee "4 es menor que V y Y es menor o igual a 6" o "Y está entre 4 y 6, excluyendo al 4 e Incluyendo 

al 6" o "Y es mayor que 4 y menor o Igual a 6". 

A las relaciones en las que intervienen signos de desigualdad se les llana desigualdades. Así como se habla de 
miembros de una ecuación, también se habla de miembros de una desigualdad. Por lo tanto, en la desigualdad 4 < V 
< 6, los miembros son 4, y y 6. 

U na desigualdad válida sigue siendo válida si: 

1. A cada miembro de la desigualdad se le suma o se le resta un mismo número. 

EJEMPLO 28 Como 15 > 12,15 + 3 > 12 + 3 (es decir, 18 > 15) y 15 - 3 > 12 - 3 (es decir, 12 > 9). 

2. Cada miembro de la desigualdad se multiplica por un mismo número positivo o se divide entre un mismo número 

positivo. 

EJEMPLO 29 Como 15 > 12, (15)(3) > (12)(3) (es decir, 45 > 36) y 15/3 > 12/3 (es decir, 5 > 4). 

3. Cada miembro se multiplica o se divide por un mismo número negativo, lo que indica que los símbolos de la de¬ 
sigualdad son invertidos. 

EJEMPLO 30 Como 15 > 12, (15)( 3) < (12)(—3) (es decir, -45 < -36) y 15/(—3) < 12/(—3) (es decir, -5 < -4). 

LOGARITMOS 

Si x > 0, b>0yb#l,y = log b x si y sólo si log b y = x. Un logaritmo es un exponente. Es la potencia a la que hay 
que elevar la bas eb para obtener el número del que se busca el logaritmo. Las dos bases más utilizadas son el 10 y la 
e, que es igual a 2.71828182... A los logaritmos base 10 se les llama logaritmos comunes y se escriben log 10 xo sim¬ 
plemente log(x). A los logaritmos basee se les llama logaritmos naturales y se escriben ln(x). 

EJEMPLO 31 Encuentre los siguientes logaritmos y después encuéntrelos usando EXCEL: log 2 8, log 5 25 y log 10 1 000. La 
potencia a laque hay que elevar al 2 para obtener 8 es tres, así log 2 8 = 3. La potencia a la que hay que elevar al 5 para obtener 25 
es dos, así log 5 25 = 2. La potencia a la que hay que elevar al 10 para obtener 1 000 es tres, así log 10 1 000 = 3. EXCEL tiene tres 
funciones para calcular logaritmos. La función LN calcula logaritmos naturales, la función LOG 10 calcula logaritmos comunes y 
la función LOG(x,b) calcula el logaritmo dex base b. =LOG (8,2) da 3, =LOG (25,5) da 2, =LOG 10(1 000) da 3. 

EJEMPLO 32 Calcule los logaritmos naturales de los números del 1 al 5 usando EXCEL. Los números 1 a 5 se ingresan en las 
celdas B1:F1 y en la celda B2 se ingresa la expresión =LN (Bl), se hace clic y se arrastra desde B2 hasta F2. EXCEL proporciona 
el siguiente resultado. 

X 1 2 3 4 5 

LN(x) O 0.693147 1.098612 1.386294 1.609438 

EJEMPLO 33 M uestre que las respuestas del ejemplo 32 son correctas mostrando que e lnW da el valor x. Los logaritmos se 
ingresan en B 1:F 1 y la expresión e lnW , que está representada por =EX P(B1) se ingresa en B2, se hace clic y se arrastra de B2 a F2. 
EXCEL da los resultados siguientes. Los números en D2 y E2 difieren de 3 y 4 debido a error de redondeo. 

LN(x) O 0.693147 1.098612 1.386294 1.609438 

x = EXP(LN(x)) 1 2 2.999999 3.999999 5 

El ejemplo 33 ilustra que si se tiene el logaritmo de un número (log b (x)) se puede volver a obtener el número x usando la relación 

¿logiM _ x 
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EJEMPLO 34 El número e puede definirse como un límite. La cantidad (1 + (l/x)) x se va acercando a e a medida que x va 
creciendo. Obsérvense las evaluaciones de EXCEL de (1 + (l/x)) x parax = 1,10,100,1 000,10 000,100 000 y 1 000 000. 

x 1 10 100 1 000 10 000 100 000 1 000 000 

(1+1/x) A x 2 2.593742 2.704814 2.716924 2.718146 2.718268 2.71828 

Los números 1, 10, 100, 1 000, 10 000,100 000 y 1 000 000 se ingresan en B1:H1 y la expresión = (1 + 1/B 1)"B 1 
se ingresa en B2, se hace clic y se arrastra de B2 a H2. Esto se expresa matemáticamente mediante la expresión 
lím^Jl + (l/x)) x = e. 

EJEMPLO 35 El saldo de una cuenta que gana interés compuesto n veces por año está dado por4(t) = P(1 + (r/n)) nt donde P 
es el capital, r es la tasa de interés, tes el tiempo en años y n es el número de periodos compuestos por año. El saldo de una cuenta 
que gana interés continuo está dado por4(t) = Pe n . Para comparar el crecimiento de $1 000 a interés continuo con el de $1 000 a 
interés compuesto trimestralmente, después de 1, 2,3,4 y 5 años, ambos a una tasa de interés de 5%, se usa EXCEL. Los resultados 
son: 


Años 12345 

Trimestralmente 1 050.95 1 104.49 1 160.75 1 219.89 1 282.04 

Continuamente 1 051.27 1 105.17 1 161.83 1 221.4 1 284.03 

Se ingresan los tiempos 1,2,3,4 y 5 en B 1:F 1; en B 2 se ingresa la expresión de EXCEL =1 000* (1.0125) “(4* B1), 
se hace clic y se arrastra desde B2 hasta F2. En B3 se ingresa la expresión =1 000*EXP(0.05*B1), se hace clic y se 
arrastra desde B3 hasta F3. El interés continuo compuesto da resultados ligeramente mejores. 

PROPIEDADES DE LOS LOGARITMOS 

Las propiedades más importantes de los logaritmos son las siguientes: 

1. log b MN = log b M + log b N 

2. log b M/N = log b M -\og b N 

3. log b M p =p log b M 

EJEMPLO 36 Escriba log b (xy 4 /z 3 ) como suma o diferencia de logaritmos dex, y y z. 

xy 4 

log¿ = l°g¿ xy 4 - log¿ z 3 propiedad 2 

z 

4 

1 og¿^ r = log¿x 
z 

4 

log b 3 = log b X 
z 


ECUACIONES LOGARÍTM ICAS 

Para resolver ecuaciones logarítmicas: 

1. Todos los logaritmos se aíslan en un lado de la ecuación. 

2. Las sumas o diferencias de logaritmos se expresan como un solo logaritmo. 

3. La ecuación obtenida en el paso 2 se expresa en forma exponencial. 

4. Se resuelve la ecuación obtenida en el paso 3. 

5. Se verifican las soluciones. 


+ log b y 4 - log b z 3 propiedad 1 
+ 4 log¿ y — 3 log fc z propiedad 3 
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EJEMPLO 37 Solucione la siguiente ecuación logarítmica: Iog 4 (x + 5) = 3. Primero, se expresa esta ecuación en forma expo¬ 
nencial comox + 5 = 4 3 = 64. A continuación se despeja x como sigue, x = 64 - 5 = 59. Por último se verifica la solución. log 4 (59 
+ 5) = log 4 (64) = 3 ya que 4 3 = 64. 

EJEMPLO 38 Resuelva la ecuación logarítmica siguiente: log(6y - 7) + logy = log(5). La suma de logaritmos se reemplaza 
como el logaritmo del producto, log(6y - 7)y = log(5). Se igualan (6y - 7)y y 5. El resultado es6y 2 - 7y = 5 o 6y 2 - 7y - 5 = 0. 
Sefactoriza esta ecuación cuadrática como (3y - 5)(2y + 1) = 0. Las soluciones son y = 5/3 y y = -1/2. El -1/2 se descarta 
como solución, ya que los logaritmos de números negativos no están definidos, y = 5/3 demuestra ser una solución cuando se 
sustituye en la ecuación original. Por lo tanto, la única solución es y = 5/3. 

EJEMPLO 39 Resuelva la ecuación logarítmica siguiente: 

ln(5x) - ln(4x + 2) =4 

La diferencia de logaritmos se convierte en el logaritmo del cociente, ln(5x/(4x + 2)) = 4. Aplicando la definición 
de logaritmo: 5x/(4x + 2) = e 4 = 54.59815. Despejando x de la ecuación 5x = 218.39260x + 109.19630 se obtiene 
x = -0.5117. Sin embargo, esta respuesta no satisface la ecuación ln(5x) - ln(4x + 2) = 4, ya que la función log no 
está definida para números negativos. La ecuación ln(5x) - ln(4x + 2) = 4 no tiene solución. 
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PROBLEMAS RESUELTOS 


VARIABLES 


1.1 En cada uno de los casos siguientes indíquesesi se trata de datos continuos o de datos discretos: 

a) Cantidad de acciones que se venden diariamente en la bolsa de valores. 

b) Temperatura registrada cada media hora en un observatorio. 

c) Vida media de los cinescopios producidos por una empresa. 

d) Ingreso anual de los profesores universitarios. 

e) Longitud de 100 pernos producidos en una fábrica 

SOLUCIÓN 

a) Discreta: Jb) continua; c) continua; d) discreta; e) continua. 

1.2 Dar el dominio de cada una de las variables siguiente e indicar si es una variable continua o discreta. 

a) Cantidad G de galones (gal) de agua en una lavadora. 

b) Cantidad B de libros en un anaquel. 

c) Suma S de la cantidad de puntos que se obtienen al lanzar un par de dados. 

d) Diámetro D de una esfera. 

e) País C en Europa. 

SOLUCIÓN 

a) Dominio: Cualquier valor desde 0 gal hasta la capacidad de la máquina. Variable: continua. 

b ) Dominio: 0,1, 2, 3,... hasta la mayor cantidad de libros que se quepan en el anaquel. Variable: discreta. 

c) Dominio: Con un solo dado se pueden obtener 1, 2, 3, 4, 5 o 6 puntos. Por lo tanto, la suma de puntos en un par de 

dados puede ser 2, 3, 4, 5, 6, 7, 8, 9,10,11 y 12, los cuales constituyen el dominio deS. Variable: discreta. 

d) Dominio: Si se considera un punto como una esfera de diámetro cero, el dominio de D son todos los valores desde 

cero en adelante. Variable: continua. 

e) Dominio: Inglaterra, Francia, A lemania, etc., que pueden representarse por medio délos números 1,2,3, etc. Variable: 
discreta. 


REDONDEO DE CANTIDADES NUMÉRICAS 

1.3 Redondear cada uno de los números siguientes como se indica: 


a) 

48.6 

a la unidad más cercana 

f) 

143.95 

a 

la décima más cercana 

b) 

136.5 

a la unidad más cercana 

g ) 

368 

a 

la centena más cercana 

0 

2.484 

a la centésima más cercana 

h) 

24 448 

al 

millar más cercano 

d) 

0.0435 

a la milésima más cercana 

i ) 

5.56500 

a 

la centésima más cercana 

e) 

4.50001 

a la unidad más cercana 

i) 

5.56501 

a 

la centésima más cercana 


SOLUCIÓN 


a) 49; b) 136; 


C) 2.48; d ) 0.044; e) 5; f ) 144.0; g ) 400; h ) 24 000; /) 5.56; y) 5.57 
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1.4 Sumar los números 4.35, 8.65, 2.95,12.45, 6.65, 7.55 y 9.75: a) directamente, b) redondeando a la décima más 
cercana de acuerdo con la convención del "entero par" y c) redondeando de manera que se Incremente el dígi- 


to antes del 5. 



SOLUCIÓN 

o) 4.35 

b) 4.4 

c) 4.4 

8.65 

8.6 

8.7 

2.95 

3.0 

3.0 

12.45 

12.4 

12.5 

6.65 

6.6 

6.7 

7.55 

7.6 

7.6 

9.75 

9.8 

9.8 

Total 52.35 

Total 52.4 

Total 52.7 


Obsérvesequeel procedimiento b) es mejor que el procedimiento c) debido a que en el procedimiento b) se minimi¬ 
za la acumulación de errores de redondeo. 


NOTACIÓN CIENTÍFICA Y CIFRAS SIGNIFICATIVAS 

1.5 Expresar cada uno de los números siguiente sin utilizar potencias de 10. 

a) 4.823 x 10 7 c) 3.8 x 10~ 7 e) 300 x 10 8 

b) 8.4 x 10“ 6 d) 1.86 x 10 5 f) 70 000 x 10-“ 

SOLUCIÓN 

a) Se recorre el punto decimal siete lugares a la derecha y se obtiene 48 230 000; b ) se recorre el punto decimal seis 
lugares a la izquierda y se obtiene 0.0000084; c) 0.000380; d) 186 000; e) 30 000 000 000; f ) 0.0000070000. 

1.6 En cada Inciso diga cuántas cifras significativas hay, entendiéndose que los números se han dado exactamente. 


a) 

149.8 ¡n 

d) 

0.00280 m 

g) 9 casas 

b) 

149.80 ¡n 

e) 

1.00280 m 

h) 4.0 x 10 3 libras (Ib) 

0 

0.0028 metros (m) 

f ) 

9 gramos (g) 

/') 7.58400 x 10- 5 dinas 

SOLUCIÓN 




a) 

Cuatro; b) cinco; 

c) dos; i 

rf) tres; e) seis; 

f) una; g) ilimitadas; b) dos; 


1.7 ¿Cuál es el error máximo en cada una délas mediciones siguientes, entendiéndose que se han registrado exac¬ 
tamente? 

a) 73.854 ¡n b) 0.09800 pies cúbicos (ft 3 ) c) 3.867 x 10 8 kilómetros (km) 

SOLUCIÓN 

a) Esta medida puede variar desde 73.8535 hasta 73.8545 in; por lo tanto, el error máximo es 0.0005 in. Hay cinco cifras 
significativas. 

b ) La cantidad de pies cúbicos puede variar desde 0.097995 hasta 0.098005 pies cúbicos; por lo tanto, el error máximo 
es 0.0005 ft 3 . H ay cuatro cifras significativas. 

c) El verdadero número de kilómetros es mayor que 3.8665 x 10 8 , pero menor que 3.8675 x 10 8 ; por lo tanto, el error 
máximo es 0.0005 x 10 8 , o 50 000 km. Hay cuatro cifras significativas. 
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1.8 Escribir cada número empleando la notación científica. A menos que se Indique otra cosa, supóngase que todas 
las cifras son significativas. 

a) 24 380 000 (cuatro cifras significativas) c) 

b) 0.000009851 d) 

SOLUCIÓN 

a) 2.438 x 10 7 ; b) 9.851 x 1Q- 6 ; c) 7.30000 x 10 9 ; 


CÁLCULOS 

1.9 M ostrar que el producto de los números 5.74 y 3.8, entendiéndose que tienen tres y dos cifras significativas, 
respectivamente, no puede ser exacto a más de dos cifras significativas. 

SOLUCIÓN 
Primer método 

5.74 x 3.8 = 21.812, pero en este producto no todas las cifras son significativas. Para determinar cuántas cifras son signi¬ 
ficativas, obsérvese que 5.74 representa algún número entre 5.735 y 5.745, y 3.8 representa algún número entre 3.75 y 3.85. 
Por lo tanto, el menor valor que puede tener este producto es 5.735 x 3.75 = 21.50625 y el mayor valor que puede tener 
es 5.745 x 3.85 = 22.11825. 

Dado que este intervalo de valores es 21.50625 a 22.11825, es claro que sólo los dos primeros dígitos del producto 
son significativos y el resultado se escribe como 22. Nótese que el número 22 se determina para cualquier número entre 
21.5 y 22.5. 

Segundo método 

I mprimiendo en cursivas las cifras dudosas, este producto se puede calcular como sigue: 

5.74 
3 8 

4592 
1 722 

21.812 

En el resultado no se debe conservar más de una cifra dudosa, por lo que el resultado es 22 a dos cifras significativas. 
Obsérvese que no es necesario trabajar con más cifras significativas que las presentes en el factor menos exacto; por lo 
tanto, si 5.74 se redondea a 5.7, el producto será 5.7 x 3.8 = 21.66 = 22, a dos cifras significativas, lo cual coincide con 
el resultado obtenido antes. 

Cuando los cálculos se hacen sin calculadora, se puede ahorrar trabajo si no se conserva más de una o dos cifras más 
de las que tiene el factor menos exacto y se redondea el resultado al número adecuado de cifras significativas. Cuando se 
usa una computadora, que puede dar muchos dígitos, hay que tener cuidado de no creer que todos los dígitos son significa¬ 
tivos. 


7 300 000 000 (cinco cifras significativas) 
0.00018400 


d) 1.8400 x 10- 4 


1.10 Sume los números 4.19355, 15.28, 5.9561, 12.3 y 8.472, entendiéndose que todas las cifras son significa¬ 
tivas. 

SOLUCIÓN 

En el cálculo a), que se presenta en la página siguiente, las cifras dudosas están en cursivas. El resultado final con no más 
de una cifra dudosa es 46.2 
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4.19355 

b ) 4.19 

15.28 

15.28 

5.9567 

5.96 

12 .3 

12.3 

8.472 

8.47 

46.20165 

46.20 


Se puede ahorrar un poco de trabajo si se hacen los cálculos como en el inciso b), donde únicamente se ha conservado un 
lugar decimal más de los que tiene el número menos exacto. El resultado final se redondea a 46.2, que coincide con el 
resultado en el inciso a). 

1.11 Calcular 475 000 000 + 12 684 000 - 1 372 410 si estos números tienen tres, cinco y siete cifras significativas, 
respectivamente. 

SOLUCIÓN 

En el cálculo a) que se muestra abajo, se conservan todas las cifras y se redondea el resultado final. En el cálculo se usa un 
método similar al del problema 1.10 b). En ambos casos las cifras dudosas aparecen en cursivas. 

a) 475 000 000 487 684 OOO b) 415 000 000 48 7 700 000 

+ 12 68 4 000 - 1 372 410 + 12 700 000 - 1 400 OOO 

487 684 OOO 48 6 311 590 487 700 OOO 48 6 300 OOO 

El resultado final se redondea a 486 000 000; o mejor aún, para indicar que hay tres cifras significativas, se escribe 
486 millones o 4.86 x 108. 


1.12. Realizar las operaciones siguientes 


a) 48.0 x 943 

b) 8.35/98 

c) (28)(4 193) (182) 

(526.7)(0.001280) 
) 0.000034921 


e) 

/) 


(1.47562 - 1.47322)(4 895.36) 
0.000159180 

Si los denominadores 5 y 6 son exactos, 


(4.38) 2 

5 


(5.482) 2 

6 


g) 3.1416 V7L35 

h) V128.5 - 89.24 


SOLUCIÓN 


a) 48.0 x 943 = (48.0)(943) = 45 300 

b) 8.35/98 = 0.085 

c) (28)(4 193)(182) = (2.8 x 10 1 )(4.193 x 10 3 )(1.82 x 10 2 ) 

= (2.8)(4.193)(1.82) x 10 1+3 + 2 = 21 x 10 6 = 2.1 = 10 7 


Lo que también puede escribirse como 21 millones, para indicar que hay dos cifras significativas. 


(526.7) (0.001280) 
0.000034921 


(5.267 x 10 2 )(l.280 x 10~ 3 ) _ (5.267)(1.2 80) (10 2 )(10 3 ) 

3.4921 x 10- 5 ~ 3.4921 X KP 


= 1.931 


X 


io 2 - 3 

10- 5 


= 1.931 x 


10 ~‘ 

1(P 


= 1.931 x 10~ 1+5 = 1.931 x 10 4 


Lo que también se puede escribir como 19.31 miles, para indicar que hay cuatro cifras significativas. 
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(1.47562 - 1.47322)(4 895.36) 
0.000159180 


(0.00240)(4 895.36) _ (2.40 x 10~ 3 )(4.89536 x 10 3 ) 
0.000159180 “ 1.59180 x 10~ 4 


(2.40)(4.89536) w (10“ 3 )(10 3 ) 
1.59180 X Hp 


= 7.38 x 


10 u 

ÜF 


= 7.38 x 10’ 


Lo que también se puede escribir como 73.8 miles para indicar que hay tres cifras significativas. Obsérvese que aunque 
originalmente en todos los números había seis cifras significativas, al sustraer 1.47322 de 1.47562 algunas de estas 
cifras significativas se perdieron. 


/) 

g) 

h) 


Si los denominadores 5 y 6 son exactos, 


(4.38) 2 

5 


3.1416VTT35 = (3.1416)(8.447) = 26.54 


V 128.5 - 89.24 = \F+3 = 6.27 


(5.482) 2 

6 


= 3.84 + 5.009 = 8.85 


1.13 


Evaluar cada una de las expresiones siguientes, con X = 3, Y = -5, A = 4 y B = -7, donde todos los números 
se supone que son exactos: 


a) 2X - 3 Y 

b) 47 - 8X + 28 

AX +BY 

c) - 

7 BX - AY 

d) X 1 - 3 XY -2 7 2 

e) 2{X +3+) -4(3X -2Y) 


f) 

g) 

h) 


X 2 - Y 2 
A 2 -B 2 + 1 

V 2X 2 — Y 2 — 3A 2 + 47? 2 + 3 


6A 2 27? 2 


SOLUCIÓN 

a) 2X — 3Y = 2(3) — 3(—5) = 6 + 15 = 21 

b) 4Y - 8X + 28 = 4(—5) - 8(3) + 28 = -20 - 24 + 28 = -16 

AX + BY _ (4)(3) + (—7)(—5) _ 12 + 35 _ 47 _ 

C ’ BX - AY ~ (—7)(3) - (4)(—5) “ -21 +20 ~ -1 “ 

d) X 2 - 3 XY - 2Y 2 = (3) 2 - 3(3)(—5) - 2(-5) 2 = 9 + 45 - 50 = 4 

e) 2{X + 3Y)-4(3X -2 Y) = 2[(3) + 3(—5)] -4[3(3) - 2(—5)] 

= 2(3 - 15) - 4(9 + 10) = 2(—12) - 4(19) = -24 - 76 = -100 

Otro método 

2(X +3y) -4(3X -27) = 2X + 67 - \2X + 87 = -107 + 147 = -10(3) = 14(—5) 

= -30 - 70 = -100 

X 2 — Y 2 (3) 2 — (~5) 2 9 - 25 -16 1 Q5 

1 A 2 -B 2 + 1 (4) 2 — (—7) 2 + 1 16 -49+ 1 -32 2 

g ) V2X 2 -Y 2 - 3 A 2 + 4B 2 + 3 = \J2{3) 2 - (-5) 2 - 3(4) 2 + 4(-7) 2 + 3 

= V18 - 25 -48 + 196 + 3 = \/T44 = 12 

,. Í6Á 2 1S 2 /6(4) 2 2(—7) 2 ¡96 98 =— , 

h) \j— + — =V^j~+ = J— + — = V\2A = 3.52 aproximadamente 


FUNCIONES Y GRÁFICAS 

1.14 En la tabla 1.1 se presentan las cantidades de bushels (bu) de trigo y de maíz producidas en una granja en los 
años 2002, 2003, 2004, 2005 y 2006. De acuerdo con esta tabla, determinar el año o los años en los que: a) se 
produjeron menos bushels de trigo, b) se produjo la mayor cantidad de bushels de maíz, c) hubo la mayor dis- 
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Tabla 1.1 Producción de trigo y maíz desde 2002 hasta 2006 


Año 

Bushels de trigo 

Bushels de maíz 

2002 

205 

80 

2003 

215 

105 

2004 

190 

110 

2005 

205 

115 

2006 

225 

120 


minución en la producción de trigo, d) se produjo una misma cantidad de trigo, e) la suma de las producción 
de trigo y maíz fue máxima. 

SOLUCIÓN 

a) 2004; b ) 2006; c) 2004; d) 2002 y 2005; e) 2006 

1.15 Sean 1/1/ y C, respectivamente, las cantidades de bushels de trigo y maíz producidas en el año ten la granja del 
problema 1.14. Es claro que 1/1/ y C son funciones de t; esto se indica como W = F(t)yC =G(t). 

a) Encontrar 1/1/ para t = 2004. 

b) Encontrare para t= 2002. 

c) Encontrar t para 1/1/= 205. 

d) EncontrarF(2005). 

e) Encontrar G (2005). 

f) Encontrare para W = 190. 

SOLUCIÓN 

a) 190 

b) 80 

C) 2002 y 2005 

d) 205 

e) 115 

f) 110 

g) Todos los años, desde el 2002 hasta el 2006. 

h) Sí, ya que a cada uno de los valores que puede tomar t le corresponde uno y sólo un valor de 1/1/. 

/) Sí, para indicar que t es función de 1/1/ se puede escribir t = H(W). 

i) Sí. 

k) Físicamente, suele considerarse que 1/1/ está determinada por ty no que t está determinada por 1/1/. Por lo tanto, tes la 
variable dependiente y 1/1/ es la variable independiente. Sin embargo, matemáticamente, en algunos casos, cualquiera 
de las dos variables puede considerarse como la variable independiente y la otra variable como la variable dependien¬ 
te. La variable independiente es a la que se le pueden asignar diversos valores, y la otra variable cuyos valores depen¬ 
den de los valores asignados es la variable dependiente. 

1.16 Una variable y está determinada por otra variable X de acuerdo con la ecuación Y = 2X - 3, donde el 2 y el 3 
son exactos. 

a) Encontrar Y paraX = 3,-2 y 1.5. 

b) Construir una tabla en la que se den los valores de Y paraX = -2, -1, 0,1, 2, 3 y 4. 

c) Si Y = F(X) denota que Y depende deX, determinar F (2.4) y F(0.8). 

d) ¿Cuál es el valor deX que corresponde a Y = 15? 

e) ¿Puede expresarseX como función de Y? 


g) ¿Cuál es el dominio de la variable t? 

h) ¿Es 1/1/ una función univaluada de t? 

/') ¿Es t función de 1/1/? 

¡) ¿Es C función de 1/1/? 

k) ¿Cuál es una variable Independiente, t o 1/1/? 
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f) ¿Es Y una función univaluada deX? 

g) ¿EsX una función univaluada de Y? 

SOLUCIÓN 

a) Para X = 3, Y = 2X - 3 = 2(3) - 3 = 6- 3 = 3. Para X = -2, Y = 2X - 3 = 2(-2) - 3 = -4 - 3 = -7. 
ParaX = 1.5, Y = 2X - 3 = 2(1.5) - 3 = 3- 3 = 0. 

b) En la tabla 1.2 se presentan los valores de y obtenidos en el inciso a). Obsérvese que se pueden construir muchas tablas 
usando otros valores deX. La relación expresada por Y = 2X - 3 es equivalente a la colección de todas esas tablas. 


Tabla 1.2 


X 

-2-10 1 2 3 4 

y 

-7 -5-3-11 3 5 


c) F (2.4) = 2(2.4) - 3 = 4.8 - 3 = 1.8 y F (0.8) = 2(0.8) - 3 = 1.6 - 3 = -1.4. 

d) En y = 2X - 3 se sustituye y = 15. Esto da 15 = 2X - 3, 2X = 18 y X = 9. 

e) Sí. Ya que y = 2X - 3, y + 3 = 2X y X = ¿(Y + 3). Así, X queda expresada explícitamente como función de Y. 

f ) Sí. Ya que para cada uno de los valores que puede tomar X (que es una cantidad infinita) hay uno y sólo un valor 

de y. 

g ) Sí. Ya que de acuerdo con el inciso e) X = \(Y + 3), de manera que para cada uno de los valores que puede tomar Y 
hay uno y sólo un valor deX. 

1.17 Si Z = 16 + 4X - 3Y, hallar el valor deZ que corresponda a: a) X = 2, Y = 5; b) X = -3, y = -7; c) X = -4, 

y = 2. 

SOLUCIÓN 

a) Z = 16 + 4(2) -3(5) = 16 + 8 - 15 = 9 

b) Z = 16 + 4(-3) -3(-7) = 16- 12 + 21 =25 

c) Z = 16 + 4(-4) - 3(2)= 16 - 16 - 6 = -6 

A valores dados deX y y, les corresponde un valor deZ. Para denotar queZ depende deX y de y se escribeZ = F(X, 
Y) (que se lee “Z es función deX y y"). F(2, 5) denota el valor deZ paraX = 2 y y = 5 que, de acuerdo con el inciso a), 
es 9. De igual manera, F(-3, -7) = 25 y F( 4, 2)= -6, de acuerdo con los incisos ó) y c), respectivamente. 

Las variables X y Y son las variables Independientes y la vari able Z es la variable dependiente. 

1.18 Los gastos fijos de una empresa son de $1 000 por día y los costos de producción de cada artículo son de 
$25. 

a) Escribir una ecuación que exprese el costo total de producción dex unidades por día. 

b) Usando EXCEL, elaborar una tabla en laque se den los costos de producción de5,10,15, 20, 25, 30, 35, 
40, 45 y 50 unidades por día. 

c) Evaluare Interpretará (100). 

SOLUCIÓN 

a) f(x) = 1 000 + 25x. 

b ) Los números 5, 10,..., 50 se ingresan en B1:K 1, la expresión = 1 000 + 25*B1 se ingresa en B2, se da clic y se 
arrastra desde B 2 hasta K2 para obtener el resultado siguiente: 

x 5 10 15 20 25 30 35 40 45 

f(x) 1 025 1 050 1 075 1 100 1 125 1 150 1 175 1 200 1 225 

c) f(100) = 1 000 + 25(100) = 1 000 + 2 500 = 3 500. Fabricar x = 100 unidades en un día cuesta 3 500. 
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1.19 El ancho de un rectángulo es x y el largo esx + 10. 

a) Escribir una función, A(x), que exprese el área en función dex. 

b) UsarEXCEL para elaborar una tabla que dé el valor de/\(x) parax = 0,1,..., 5. 

c) Escribir una función, P(x), que exprese el perímetro en función dex. 

d) UsarEXCEL para elaborar una tabla que dé el valor deP(x) parax = 0,1,...,5. 

SOLUCIÓN 

a) A(x) =x(x + 10) =x 2 + lOx 

b) En las celdas B1:G1 se Ingresan los números 0,1, 2, 3, 4 y 5; en la celda B2 se Ingresa la expresión =B1''2+10*B1, 
se da clic y se arrastra desde B 2 hasta G2 con lo que se obtiene: 

X O 1 2 3 4 5 

A(x) Olí 24 39 56 75 

c) P(x) =x + (x +10)+x + (x + 10) = 4x + 20. 

cf) En las celdas B1:G1 se ingresan los números 0,1, 2, 3, 4 y 5; en la celda B2 se ingresa la expresión =4*Bl+20, se 
da clic y se arrastra desde B2 hasta G2 con lo que se obtiene: 

X O 1 2 3 4 5 

P(x) 20 24 28 32 36 40 

1.20 En un sistema de coordenadas rectangulares localizar los puntos que tienen como coordenadas: a) (5, 2), b) (2, 
5), c) (-5,1), d) (1, -3), e) (3, -4), f) (-2.5, -4.8), g) (0, -2.5) y h) (4, 0). Usar M APLE para graficar estos 
puntos. 

SOLUCIÓN 

Véase la figura 1-2. A continuación se da el comando de M APLE para graficar estos ocho puntos. Cada punto está repre¬ 
sentado por un círculo. 

L : = [[5, 2], [2, 5], [-5,1], [1, -3], [3, -4], [-2.5, -4.8], [0, -2.5], [4, 0]]; 
pointplot ( L, font = [TIMES, BOLO, 14], symbol = circle ); 
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1.21 G raficar la ecuación Y = 4X - 4 usando M INITAB. 

SOLUCIÓN 

Obsérvese que la gráfica se extiende indefinidamente tanto en dirección positiva como en dirección negativa del ejeX. Aquí 
se decidió, arbitrariamente, graficar sólo desde -5 hasta 5. En la figura 1-3 se muestra el diagrama de la recta Y = 4X - 4 
obtenida con M INITAB. De la barra de herramientas se selecciona la secuencia "Graph => Scatterplots" para activar scat- 
ter plots (gráfica de dispersión). Los puntos sobre la recta se obtienen ingresando los enteros desde -5 hasta 5 y usando la 
calculadora de M IN ITAB para calcular los valores correspondientes de Y. Los valores deX y V son los siguientes: 

X -5 -4 -3 -2 -1 0 1 2 3 4 5 

Y -24 -20 -16 -12 -8 -4 O 4 8 12 16 

Los puntos se han unido para dar una idea de cómo se ve la gráfica de la ecuación Y = 4X - 4. 


Y 



1.22 G rafi que la ecuación Y = 2X 2 - 3X - 9 usando EXCEL. 

SOLUCIÓN 


Tabla 1.3 Valores de una función cuadrática generados con EXCEL 


X 

-5 

-4 

-3 

-2 

-1 

0 

1 

2 

3 

4 

5 

Y 

56 

35 

18 

5 

-4 

-9 

-10 

-7 

0 

11 

26 


Se usó EXCEL para elaborar esta tabla que da los valores de Y para los valores deX igual a -5, -4,..., 5. Se ingresa la 
expresión =2*Bl / '2-3*Bl-9 en la celda B2, se da clic y se arrastra desde B2 hasta L2. Para obtener la gráfica que se 
muestra en la figura 1-4 se usa el asistente para gráficos de EXCEL. Ésta es una función cuadrática. Las raíces (puntos en 
los que la gráfica cruza el ejex) de esta función cuadrática están una en X = 3 y la otra entre -2 y -1. Haciendo clic sobre 
el asistente para gráficos de EXCEL, se muestran las diversas gráficas que es posible hacer. Obsérvese que a medida que 
X toma valores cada vez más grandes, tanto positivos como negativos, la gráfica de esta función cuadrática va hacia el 
infinito positivo. Obsérvese también que la gráfica toma su valor más bajo cuando X está entre O y 1. 

1.23 La tabla 1.4 muestra el aumento de la cantidad de diabéticos desde 1997 hasta 2005. Grafique estos datos. 


Tabla 1.4 Cantidad de nuevos diabéticos 


Año 

1977 

1998 

1999 

2000 

2001 

2002 

2003 

2004 

2005 

M Ilíones 

0.88 

0.90 

1.01 

1.10 

1.20 

1.25 

1.28 

1.36 

1.41 
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eje y 



Figura 1-4 Diagrama EXCEL deuna curva llamada parábola. 


SOLUCIÓN 
Primer método 

La primer gráfica que se muestra en la figura 1-5 es la gráfica de una serie de tiempos. En este diagrama se presentan los 
nuevos casos de diabetes desde 1997 hasta 2005. Se muestra que durante este periodo la cantidad de nuevos casos ha ido 
aumentando. 

Segundo método 

A la figura 1-6 se le conoce como gráfica de barras, carta de barras o diagrama de barras. El ancho de las barras, que en 
todas es el mismo, no tiene ningún significado en este caso y pueden ser de cualquier tamaño en tanto no se traslapen. 



Figura 1-5 MINITAB, serie de tiempos de nuevos casos de diabetes por año. 
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Año 


Figura 1-6 MINITAB, gráfica de barras de los nuevos casos de diabetes por año. 


Tercer método 

En la figura 1-7 se muestra una gráfica de barras en la que las barras son horizontales en vez de verticales. 



Millones 

Figura 1-7 MINITAB, gráfica de barras horizontales de nuevos casos de diabetes por año. 


1.24 Grafique los datos del problema 1.14 usando una gráfica de M INITAB para serie de tiempos, una gráfica de 
barras agrupadas con efecto tridimensional (3-D) de EXCEL y una gráfica de barras apiladas con efecto 3-D 
deEXCEL. 

SOLUCIÓN 

Las soluciones sedan en las figuras 1-8,1-9 y 1-10. 
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Variable 

• Bushels de trigo 
—■— Bushels de maíz 


Figura 1-8 MINITAB, serie de tiempos déla producción (2002 a 2006) de trigo y maíz. 



□ Bushels de trigo 

□ Bushels de maíz 


Figura 1-9 EXCEL, barras agrupadas con efecto 3-D. 


1.25 a) Expresar las cantidades anuales de bushels de trigo y de maíz, presentadas en la tabla 1.1 del problema 1.4, 
como porcentajes de la producción anual total. 
b) Graficar los porcentajes obtenidos en el Inciso a). 

SOLUCIÓN 

a) El porcentaje de trigo correspondiente al 2002 es = 205/(205 + 80) = 71.9% y porcentaje de maíz = 100% - 71.9% 
= 28.1%, etc. Estos porcentajes se muestran en la tabla 1.5. 

b) Las columnas apiladas 100% comparan los porcentajes con la contribución de cada valor al total de cada categoría 
(figura 1-11). 
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□ Bushels de maíz 

□ Bushels de trigo 


Año 

Figura 1-10 EXCEL, barras apiladas con efecto 3-D. 


Tabla 1.5 Producción de trigo y maíz desde 2002 hasta 2006 


Año 

Trigo (%) 

Maíz (%) 

2002 

71.9 

28.1 

2003 

67.2 

32.8 

2004 

63.3 

36.7 

2005 

64.1 

35.9 

2006 

65.2 

34.8 



□ Maíz (%) 

□ Trigo (%) 


Año 


Figura 1-11 EXCEL,columnas 100% apiladas. 
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1.26 En un número reciente de USA Today, una nota titulada "Peligro en línea", informa de un estudio realizado en 
1 500 niños entre 10 y 17 años de edad. Presentar la información de la tabla 1.6 en una gráfica de barras agru¬ 
padas y en una gráfica de barras apiladas. 


Tabla 1.6 



Prostitución 

Contacto con la pornografía 

Acoso 

2000 

19% 

25% 

6% 

2005 

13% 

34% 

9% 


SOLUCIÓN 

En la figura 1-12 se muestra la gráfica de barras con columnas agrupadas y en la figura 1-13 la gráfica de barras con colum¬ 
nas apiladas obtenida con esta información. 


o 

G3 1 


40 -r 

35 - 

30 - 

25 - 

20 - 

15 - 

10 - 

5 - 

O -■ 


Prostitución Contacto con Acoso 

la pornografía 


□ 2000 
□ 2005 


Figura 1-12 EXCEL, gráfica de barras con columnas agrupadas. 


70 


60 - 

50 - 


■ 2, 40 - 

C3 

<U 

p 

£ 30 - 


20 - 


10 - 


0 -I--L- 

Prostitución 


□ 2005 

□ 2000 


Contacto con Acoso 

la pornografía 


Figura 1-13 EXCEL, gráfica debarrascon columnas apiladas. 
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1.27 En una nota reciente de USA Today titulada "¿Dónde están los estudiantes universitarios?", seinformó que en 
Estados Unidos hay más de 17.5 millones de universitarios que estudian en más de 6 400 escuelas. En la tabla 
1.7 se da la matrícula de acuerdo al tipo de escuela. 


Tabla 1.7 ¿Dónde están los estudiantes universitarios? 


Tipo de escuela 

Porcentaje 

Pública de2 años 

43 

Pública de4 años 

32 

Privada no lucrativa de 4 años 

15 

Privada de 2 y 4 años 

6 

Privada de menos de 4 años 

3 

Otras 

1 


Con la información de la tabla 1.7 construya una gráfica de barras 3-D usando EXCEL y una gráfica de barras usando 
MINITAB. 

SOLUCIÓN 

Las figuras 1-14 y 1-15 dan las gráficas pedidas. 




Tipo de escuela 

Figura 1-15 MINITAB, gráfica de barrascon los datos de la tabla 1.7. 
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1.28 


Los estadounidenses tienen en promedio 2.8 televisores por hogar. Con los datos de la tabla 1.8 elabore una 
gráfica de pastel usando EXCEL. 


Tabla 1.8 Televisores por hogar 


Televisores 

Porcentaje 

Ninguno 

2 

Uno 

15 

Dos 

29 

Tres 

26 

Cuatro 

16 

M ás de cinco 

12 


SOLUCIÓN 

En la figura 1-16 se presenta la gráfica de pastel obtenida con EXCEL para los datos de la tabla 1.8. 



26 % 

Figura 1-16 EXCEL, gráfica de pastel con la información déla tabla 1.8. 


ECUACIONES 

1.29 Resuelva las siguientes ecuaciones: 

a) 4a -20 =8 c) 18 - 5b = 3(b + 8) + 10 

Y + 2 Y 

b) 3X + 4 = 24 — 2X d) —+ i = — 

SOLUCIÓN 

a) Sumar 20 a ambos miembros: 4a - 20 + 20 = 8 + 20 o bien 4a = 28. 

Dividir ambos lados entre 4: 4a/4 = 28/4 y a = 7. 

Verificación: 4(7) - 20 = 8, 28 - 20 = 8 y 8 = 8. 

b) Restar 4 de ambos miembros: 3X + 4- 4 = 24-2X-4o bien 3X = 20 - 2X. 

Sumar 2X a ambos lados: 3X + 2X = 20 - 2X + 2X o bien 5X = 20. 

Dividir ambos lados entre 5: 5X/5 = 20/5 y X = 4. 

Verificación: 3(4) + 4 = 24 - 2(4), 12 + 4 = 24 - 8 y 16 = 16. 

Este resultado se puede obtener mucho más rápidamente si se observa que todos los términos se pueden pasar 
o trasponer de un miembro a otro de la ecuación cambiándoles simplemente el signo. Así, se puede escribir 

3X + 4 = 24 - 2X 3X + 2X = 24 - 4 5X = 20 X = 4 
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c) 18 - 5b = 3b + 24 + 10 y 18 - 5b = 34. 

Transponiendo, -5b - 3b = 34 - 18 o bien -8 b = 16. 

Dividiendo entre -8, -8b/(-8) = 16/{—8) y b = - 2. 

Verificación: 18 - 5(-2) = 3(-2 + 8) + 10,18 + 10 = 3(6) + 10 y 28 = 28. 

d) Primero se multiplican ambos miembros por 6, que es el mínimo común denominador. 


Y +2 


+ 1 = 6 { — 


2Y + 4 + 6 = 3 Y 


Y+ 2 


2Y + 10 = 3 Y 


+ 6 ( 1 ) = 


6 Y 


2(Y + 2) + 6 = 3 + 


10 = 3Y -2Y 


Y = 10 


10 + 2 10 12 10 

Verificación: — -h 1 = —, — + 1 = —, 4+l=5y5=5. 


1.30 Resolver los siguientes sistemas de ecuaciones simultáneas: 

a) 3a — 2b = 11 b) 5X + 14+ = 78 c) 3a + 27? + 5c =15 

5a + 7b = 39 IX + 3+ = -7 la - 3b + 2c = 52 

5a + b — 4c = 2 


SOLUCIÓN 


a) M ultiplicando la primera ecuación por 7: 
M ultiplicando la segunda ecuación por 2: 
Sumando: 

Dividiendo entre 31: 


21a - 14Z? = 77 
10a + 14b = 78 
31a = 155 

a = 5 


(1) 

( 2 ) 


Obsérvese que multiplicando cada una de las ecuaciones dadas por un número adecuado, se obtienen las ecua¬ 
ciones equivalentes (1) y (2), en las que los coeficientes de la variable b son numéricamente iguales. Después, suman¬ 
do las dos ecuaciones se elimina la incógnita b y se encuentra a. 

Sustituyendo a = 5 en la primera ecuación: 3(5) -2b = 11, -2b = -4 y b = 2. Por lo tanto, a = 5 y b = 2. 
Verificación: 3(5) - 2(2) = 11,15 - 4 = 11 y 11 = 11; 5(5) + 7(2) = 39, 25 + 14 = 39 y 39 = 39. 


b) 


M ultiplicando la primera ecuación por 3: 15X+42Y=234 (3) 

M ultiplicando la segunda ecuación por -14: -98X -42+ = 98 (4) 

Sumando: -83X = 332 

Dividiendo entre-83: X = -4 

Sustituyendo X = -4 en la primera ecuación: 5(-4) + 14Y = 78,14Y = 98, y Y = 7. 

Por lo tanto, X = -4y Y = 1. 

Verificación: 5( 4) + 14(7) = 78, -20 + 98 = 78 y 78 = 78; 7( 4) + 3(7) = -7, -28 + 21 = -7 y -7 = -7. 


c) M ultiplicando la primera ecuación por 2: 6a + 4b+10c = 30 

M ultiplicando la segunda ecuación por -5: -35a + 15¿? - 10c = -260 

Sumando: -29a + 19b =-230 

M ultiplicando la segunda ecuación por 2: 14a- 6 b+ 4 c= 104 

Repitiendo la tercera ecuación: 5a + b - 4c = 2 

Sumando: 19a- 5b = 106 


(5) 

( 6 ) 


De esta manera se ha eliminado c y quedan dos ecuaciones (5) y (6), que deben resolverse simultáneamente para 
encontrar ay b. 


M ultiplicando la ecuación (5) por 5: 
M ultiplicando la ecuación (6) por 19: 
Sumando: 

Dividiendo entre 216: 


— 145a + 95b = -1150 
361a — 95b = 2014 

216 a = 864 

a = 4 


Sustituyendo a = 4 en la ecuación (5) o bien (6), se encuentra que b = -6. 
Sustituyendo a = 4 y b = -6 en cualquiera de las ecuaciones dadas, se obtiene c = 3. 
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Por lo tanto, a = 4, b = -6 y c = 3. 

Verificación: 3(4) + 2( 6) + 5(3) = 15 y 15 = 15; 7(4) - 3(-6) + 2(3) = 52 y 52 = 52; 5(4) + (-6) - 4(3) = 2 y 
2 = 2 . 

DESIGUALDADES 

1.31 Expresar con palabras el significado de: 

a) N >30 b) X < 12 c) 0 < p < 1 d) 2t<X<fi + 2t 

SOLUCIÓN 

a) N es mayor que 30. 

b ) X es menor o igual a 12. 

c) p es mayor que cero y menor o Igual a 1. 

d) X es mayor que 2t pero menor que + 2t. 

1.32 Traducir a símbolos lo siguiente: 

a) La varlableX toma valores entre 2 y 5 Inclusive. 

b) La media aritmética X es mayor que 28.42 y menor que 31.56. 

c) m es un número positivo menor o Igual a 10. 

d) P es un número no negativo. 

SOLUCIÓN 

a) 2 < X < 5; b) 28.42 < X < 31.56; c) 0 <m< 10; d) P > 0. 


1.33 Empleando los signos de desigualdad, ordenar los números 3.42, -0.6, -2.1,1.45 y -3 en a) en orden crecien¬ 
te de magnitud y en b) en orden decreciente de magnitud. 

SOLUCIÓN 

a) -3 <-2.1 <-0.6 < 1.45 < 3.42 

b) 3.42 > 1.45 >-0.6 >-2.1 >-3 

Obsérvese que cuando estos puntos se graflcan como puntos en la línea (ver problema 1.18), aumentan de Izquierda a 
derecha. 

1.34 Resolver cada una de las desigualdades siguientes (es decir, despejarX): 

3 — 2X 

a) 2X <6 c) 6-4XC-2 é) -1 <—-—<7 

b) 3X - 8 > 4 d) -3 < < 3 

SOLUCIÓN 

a) Dividiendo ambos lados entre 2 se obtleneX <3. 

b ) Sumando 8 a ambos lados, 3X > 12; dividiendo ambos lados entre 3, X > 4. 

c) Sumando -6 a ambos lados, -4X <-8; dividiendo ambos lados entre-4, X > 2. Obsérvese que como ocurre en las 
ecuaciones, también en una desigualdad se puede transponer un término de un lado a otro de la desigualdad cambian¬ 
do simplemente el signo del término; por ejemplo, en el Inciso b), 3X > 8 + 4. 

d) M ultlplicando por 2, -6 < X - 5 <6; sumando 5, -1 < X < 11. 

e) M ultiplicando por 5, - 5 < 3 - 2X < 35; sumando -3, -8 < -2X < 32; dividiendo entre -2, 4 > X > -16, o bien 
-16 <X < 4. 
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LOGARITMOS Y PROPIEDADES DE LOS LOGARITMOS 

1.35 Utilizar la definición y = log fa x para hallar los logaritmos siguientes y después usar EXCEL para verificar la 
respuesta. (Obsérvese que y = log b x significa que b y = x. 

a) Encontrar el log de base 2 de 32. 

b) Encontrar el log de base 4 de 64. 

c) Encontrar el log de base 6 de 216. 

d) Encontrar el log de base 8 de 4 096. 

e) Encontrar el log de base 10 de 10 000. 

SOLUCIÓN 

a) 5; b) 3; c) 3; cf)4; e) 4. 

La expresión de EXCEL =LOG(32,2) da5, =LOG(64,4) da 3, =LOG(216,6) da 3, =LOG(4 096,8) da 4 y =LOG(10 000, 
10) da 4. 

1.36 Empleando las propiedades de los logaritmos, volver a escribir los logaritmos siguientes como sumas y dife¬ 
rencias de logaritmos. 




a) 


Empleando las propiedades délos logaritmos, reescri bi r los logaritmos siguientes como un solo logaritmo, 
c) ln(5) + ln(10) - 2 ln(5) d) 2 log(5) - 3 log(5) + 5 log(5) 

SOLUCIÓN 

a) 2 ln(jc) + 3 ln(y) + ln(z) — ln(fl) — ln(£>) 
tí) 2 log (a) + 3 log(ó) + log(c) - log (y) - log(z) 

c) ln(2) 

d ) log (625) 

1.37 Usando SAS y SPSS, graficar y = ln(x). 

SOLUCIÓN 

Las soluciones se muestran en las figuras 1-17 y 1-18. 


3.00 - 

2.00 - 

1.00 - 

o.oo - 

- 1.00 - 

- 2.00 - 

- 3.00 - 


0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 


X 


Figura 1-17 Gráfica SPSS dey= ln(x). 
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0 2 4 6 8 10 12 14 


X 

Figura 1-18 Gráfica SAS dey= ln(x). 


Las figuras 1-17 y 1-18 muestran una gráfica de la curva y = ln(x). A medida quex se aproxima a O, los valores 
de ln(x) se aproximan cada vez más a -oo. A medida que x crece, los valores de ln(x) se aproximan 

a +oo. 

ECUACIONES LOGARÍTMICAS 

1.38 Resolver la ecuación logarítmica ln(x) = 10. 

SOLUCIÓN 

Empleando la definición de logaritmo, x = e 10 = 22026.47. Como verificación se saca el logaritmo natural de 22026.47 y 
se obtiene 10.00000019. 


1.39 Resolver la ecuación logarítmica log(x + 2) + log(x - 2) = log(5). 

SOLUCIÓN 

El lado izquierdo se puede escribir como log[(x + 2)(x - 2)]. Se obtiene la ecuación logfx + 2)(x- 2) = log(5), de la cual 
(x + 2)(x - 2) = (5). A partir de la cual sigue la ecuación x 2 - 4 = 5 o bien x 2 = 9 o bien x = -3 o bien 3. Cuando estos 
valores se verifican en la ecuación original, x = -3 debe descartarse como solución porque el logaritmo de números nega¬ 
tivos no está definido. Si en la ecuación original se sustituye x = 3, se tiene log(5) + log(l) = log(5), ya que log(l) = 0. 

1.40 Resuelva la ecuación logarítmica logia + 4) - logia - 2) = 1. 

SOLUCIÓN 

Esta ecuación se puede escribir como log((a + 4)/(a - 2)) = 1. Aplicando la definición de logaritmo, se tiene 
(a + 4)/(a - 2) = 10 1 o bien a + 4 = 10a - 20. Despejando a, a = 24/9 = 2.6 (siendo el 6 periódico). Sustituyendo en 
la ecuación original a por 2.6667, se tiene 0.8239 - (-0.1761) = 1. La única solución es 2.6667. 
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1.41 Resolver la ecuación logarítmica ln(x) 2 -1 = 0. 

SOLUCIÓN 

Esta ecuación se puedefactorlzar como [ln(x) + l][ln(x) - 1] = 0. Haciendo el factor ln(x) + 1 = 0, se obtiene ln(x) = -1 
o bien x = e _1 = 0.3678. Haciendo el segundo factor ln(x) - 1 = 0, se tiene ln(x) = 1 o bien x = e 1 = 2.7183. Ambos 
valores son solución de la ecuación. 

1.42 En la ecuación logarítmica siguiente, despejarx: 2log(x + 1) - 31 og(x + 1) = 2. 

SOLUCIÓN 

Esta ecuación se puede escribir como log[(x + l) 2 /(x + l) 3 ] = 2 o bien log[l/(x + 1)] = 2 o bien log(l) - log(x + 1)] = 2 
o bien 0 - log(x + 1) = 2 o bien log(x + 1) = -2 o bien x + 1 = 10~ 2 o bien x = -0.99. Sustituyendo en la ecuación 
original, se encuentra 2 log(0.01) - 3 log(0.01) = 2. Por lo tanto, la solución satisface la ecuación. 

1.43 Para resolver ecuaciones logarítmicas que no son fáciles de resolver a mano, se puede usar el paquete de soft¬ 
ware M A PLE. Resolver la ecuación siguiente usando M APLE. 

log(x + 2) - ln(x 2 ) = 4 

SOLUCIÓN 

El comando de M APLE para resolver la ecuación es "solve(logl0(x + 2) - ln(x"2) = 4);" la solución dada es -0.154594. 
Obsérvese que M A PLE usa loglO para el logaritmo común. 

Para comprobar que la solución es correcta, sustituyendo en la ecuación original se tiene log(l.845406) - ln(0.023899) 
que es igual a 4.00001059. 

1.44 EXCEL también se puede usar para resolver ecuaciones logarítmicas. Resolver la siguiente ecuación logarít¬ 
mica usando EXCEL: log(x + 4) + ln(x + 5) = 1. 


SOLUCIÓN 

En la figura 1-19 se da la hoja de cálculo de EX CEL. 


-3 

-0.30685 

-2 

0.399642 

-1 

0.863416 

0 

1.211498 

1 

1.490729 

2 

1.724061 

3 

1.92454 

4 

2.100315 

5 

2.256828 

-3 

-0.30685 

-2.9 

-0.21667 

-2.8 

-0.13236 

-2.7 

-0.05315 

-2.6 

0.021597 

-2.5 

0.092382 

-2.4 

0.159631 

-2.3 

0.223701 

-2.2 

0.284892 

-2.1 

0.343464 

-2 

0.399642 

Figura 1-19 

EXCEL, 1 


LOG10(A1 +4)+LN(A1 +5)“ 


LOG10(A11 +4)+LN(A11 +5)“ 
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Se puede usar la técnica iterativa que se muestra antes. La mitad superior encuentra que la raíz de log(x + 4) + ln(x + 5) 
- 1 está entre -3 y -2. La mitad Inferior encuentra que la raíz está entre -2.7 y -2.6. Para dar la raíz con la exactitud que 
se desee, sólo hace falta continuar con este proceso. Al usar esta técnica se emplea la de clic y arrastre. 

1.45 Encuentre la solución al problema 1.44 usando M APLE. 

SOLUCIÓN 

El comando de M APLE ">solve(log 10(x + 4) + ln(x + 5) = 1);" da como solución -2.62947285. Compare este resul¬ 
tado con el obtenido en el problema 1.44. 


PROBLEMAS SUPLEMENTARIOS 


VARIABLES 

1.46 Cuáles de los datos siguientes son datos discretos y cuáles son datos continuos. 

a) Precipitación pluvial, en pulgadas, en una ciudad, en diversos meses del año. 

b) Velocidad de un automóvil, en millas por hora. 

c) Cantidad de billetes de $20 que circulan en Estados U nidos en determinado momento. 

d) Valor total diario de las acciones vendidas en la bolsa. 

e) Cantidad de estudiantes Inscritos anualmente en una universidad. 

1.47 Dar el dominio de cada una de las variables siguientes e indicar si es una variable discreta o continua. 

a) Cantidad anual 1/1/ de bushels de trigo por acre que se producen en una granja. 

b) Cantidad N de individuos en una familia. 

c) Estado civil de un individuo. 

d) Tiempo T de vuelo de un misil. 

e) Número P de pétalos que tiene una flor. 

REDONDEO DE CANTIDADES NUMÉRICAS, NOTACIÓN CIENTÍFICA Y CIFRAS SIGNIFICATIVAS 

1.48 Redondear cada uno de los números siguientes como se indica. 


a) 

3 256 

a la centena más cercana 

b) 

5.781 

a la décima más cercana 

0 

0.0045 

a la milésima más cercana 

d) 

46.7385 

a la centésima más cercana 

e) 

125.9995 

a dos lugares decimales 

f) 

3 502 378 

al millón más cercano 

g) 

148.475 

a la unidad más cercana 

h ) 

0.000098501 

a la millonésima más cercana 

i) 

2 184.73 

a la decena más cercana 

i) 

43.87500 

a la centésima más cercana 

Expresar cada número sin usar potencias de 10. 

a) 

132.5 x 10 4 

d) 1 300 x 10 6 

b) 

418.72 x 10- 5 

e) 3.487 x ÍO^ 4 

c) 

280 x 10- 7 

f) 0.0001850 x 10 5 
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1.50 ¿Cuántas cifras significativas hay en cada una de las cantidades siguientes entendiendo que se han registrado exactamente? 

a) 2.54 cm 


b) 0.004500 yd 

c) 3 510 000 bu 

d) 3.51 millones de bu 

e) 10.000100 ft 

f) 378 personas 


g) 378 oz 

h) 4.50 x 10~ 3 km 

/) 500.8 x 10 5 kg 

j) 100.00 mi 


1.51 ¿Cuál es el error máximo en cada una de las mediciones siguientes, entendiéndose que han sido registradas exactamente? 
E n cada caso dar el número de cifras significativas. 


a) 7.20 millones bu 

b) 0.00004835 cm 


c) 5 280 ft 

d) 3.5 x 10 8 m 


e) 186 000 ml/s 

f) 186 mil mi/s 


1.52 Escribir cada uno délos números siguientes en notación científica. Supóngase que todas las cifras son significativas a menos 
que se indique otra cosa. 


a) 0.000317 

b) 428 000 000 (cuatro cifras significativas) 

c) 21 600.00 


d) 0.000009810 

e) 732 mil 

f) 18.0 diezmilésimas 


CALCULOS 
1.53 


M ostrar que: a) el producto y b ) el cociente de los números 72.48 y 5.16, considerando que tienen cuatro y tres cifras sig¬ 
nificativas, respectivamente, no puede ser exacto a más de tres cifras significativas. Escribir el producto y el cociente 
exactos. 


1.54 Realizar cada una de las operaciones indicadas. A menos que se indique otra cosa, supóngase que los números se han regis¬ 
trado exactamente. 


a) 0.36 x 781.4 
873.00 
4.881 

c) 5.78 x 2 700 x 16.00 
0.00480 x 2 300 


d) 

e) 

/) 


0.2084 


Vl20 x 0.5386 x 0.4614 (120 exactos) 

(416 000)(0.000187) 

V73J4 


g) 14.8641 +4.48 - 8.168 + 0.36125 

h) 4 173 000 - 170 264 + 1 820 470 - 78 320 

(estos números son exactos a cuatro, seis, seis y cinco 
cifras significativas, respectivamente) 


/7(4.386) 2 - 3(6.47) 2 


(el 3, el 6 y el 7 son exactos) 


j) 4.120 


/3.1416[(9.483) 2 - (5.075) 2 ] 


0.0001980 


1.55 Evaluar cada una de las expresiones siguientes, si U = -2, V = 4 W = 3, X = -4, Y = 9 y Z = j¡, donde se entien¬ 


de que todos los números son exactos. 
a) 4U + 6V - 2W 


b) 

c) 


XYZ 

uvw 

2X -3 Y 
UW +2C+ 


d) 3 {U-X) 2 + Y 

e) Vi/ 2 - 2 UV + W 

f) 2X(4Y +3Z)-2Y(6X -5Z)-25 
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( W _ 2 ) 2 (y _ 5 ) 2 
V z 


^J(Y -4) 2 + (í/+5) 2 


FUNCIONES,TABLASY GRÁFICAS 

1.56 U na variable Y está determinada por una variableX de acuerdo con la ecuación Y = 10 - 4X. 

a) Encontrar el valor de Y paraX = -3, -2, -1, 0,1, 2, 3, 4 y 5 y presentar los resultados en una tabla. 

b) Encontrar el valor de Y paraX = -2.4, -1.6, -0.8,1.8, 2.7, 3.5 y 4.6. 

c) SI Y = F(X) denota que Y depende deX, hallar F (2.8), F (-5), F(V 2) y F(-n). 

d ) Dar el valor deX que corresponde a Y = -2, 6, -10,1.6,16, 0 y 10. 

e) Expresar X explícitamente como función de Y. 

1.57 SI Z = X 2 - Y 2 , encontrar el valor de Z para: a) X = -2, Y = 3 y b) X = 1, Y = 5. c) Si se usa la notación funcional 
Z = F (X, Y), encontrar F (-3, -1). 

1.58 Si 1/1/ = 3XZ - 4Y 2 + 2XY, encontrar el valor de 14/ para: a) X = 1, Y = -2, Z = 4 y b) X = -5, Y = -2, Z = 0. c) Si se usa 
la notación funcional 1/1/ = F (X, Y, Z), encontrar F (3,1, -2). 


1.59 En un sistema de coordenadas rectangulares, localizar los puntos cuyas coordenadas son: a) (3, 2), b ) (2, 3), c) (-4, 4), 
d) (4, -4), e) (-3, -2 ),f) (-2, -3), g) (-4.5, 3), h) (-1.2, -2.4), i) (0, -3) y y) (1.8, 0). 


1.60 Grafique las ecuaciones: a) Y = 10 - 4X (ver problema 1.56), b) Y = 2X + 5, c) Y = 1(X - 6), d) 2X + 3Y = 12 y 
e) 3X - 2Y = 6. 

1.61 Graficar las ecuaciones: a) Y = 2X 2 + X - 10 y b) Y = 6 - 3X - X 2 . 

1.62 Graficar Y = X 3 - 4X 2 + 12X - 6. 

1.63 En la tabla 1.9 se presenta la cantidad de gimnasios y la cantidad de sus miembros en millones para los años desde 2000 
hasta 2005. Emplear un paquete de software para trazar una gráfica de serie de tiempos para los gimnasios y otra para sus 
miembros. 


Tabla 1.9 


Año 

2000 

2001 

2002 

2003 

2004 

2005 

Gimnasios 

M iembros 

13 000 
32.5 

13 225 
35.0 

15 000 
36.5 

20 000 
39.0 

25 500 
41.0 

28 500 
41.3 


Emplear un paquete de software para trazar, con los datos de la tabla 1.9, una gráfica de barras de los gimnasios y de los 
miembros. 

Emplear EXCEL para trazar, con los datos de la tabla 1.9, un diagrama de dispersión de los gimnasios y de los miembros. 

En la tabla 1.10 se da la mortalidad infantil por 1 000 nacidos vivos, para blancos y para no blancos, desde el año 2000 
hasta el 2005. U sar una gráfica adecuada para representar estos datos. 


1.64 

1.65 

1.66 



o 2C 3 + 5X 2 -6X-8 
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Tabla 1.10 


Año 

2000 

2001 

2002 

2003 

2004 

2005 

Blancos 

6.6 

6.3 

6.1 

6.0 

5.9 

5.7 

No blancos 

7.6 

7.5 

7.3 

7.2 

7.1 

6.8 


1.67 En la tabla 1.11 se dan las velocidades orbitales de los planetas de nuestro sistema solar. Graficar estos datos. 

Tabla 1.11 


Planeta 

M ercurlo 

Venus 

Tierra 

M arte 

J úplter 

Saturno 

U rano 

Neptuno 

Plutón 

Velocidad 

(mi/s) 

29.7 

21.8 

18.5 

15.0 

8.1 

6.0 

4.2 

3.4 

3.0 


1.68 En la tabla 1.12 se da la matrícula (en miles) de las escuelas públicas en los niveles kínder a grado 8, grado 9 a grado 12, y 
universidad, de 2000 a 2006. Graficar estos datos usando gráficas de línea, de barras y de columna apilada. 


1.69 Graficar los datos de la tabla 1.12 en una gráfica de columnas 100% apiladas. 


Tabla 1.12 


Año 

2000 

2001 

2002 

2003 

2004 

2005 

2006 

Kinder a grado 8 

33 852 

34 029 

34 098 

34 065 

33 882 

33 680 

33 507 

Grados 9 a 12 

13 804 

13 862 

14 004 

14 169 

14 483 

14 818 

15 021 

Universidad 

12 091 

12 225 

12 319 

12 420 

12 531 

12 646 

12 768 


Fuente: U .5. I\l ational Center for Educational Statistics and Projections of Education Statistic, annual. 


1.70 En la tabla 1.13 se muestra el estado civil de varones y mujeres (18 años o mayores) en Estados U nidos en 1995. Graficar 
estos datos en: a) gráficas de pastel de un mismo diámetro y b) una gráfica a elegir. 


Tabla 1.13 


Estado civil 

Varones 

(porcentaje del total) 

M ujeres 

(porcentaje del total) 

Solteros 

26.8 

19.4 

Casados 

62.7 

59.2 

Viudos 

2.5 

11.1 

Divorciados 

8.0 

10.3 


Fuente: U .S. Bureau of Census-Current Population Reports. 


1.71 En la tabla 1.14 se da la cantidad de reclusos menores de 18 años en las prisiones estatales de Estados U nidos, de 2001 a 
2005. Graficar estos datos en el tipo adecuado de gráficas. 


Tabla 1.14 


Año 

2001 

2002 

2003 

2004 

2005 

Cantidad 

3 147 

3 038 

2 741 

2 485 

2 266 
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1.72 En la tabla 1.15 se da la cantidad (en millones) de visitas al Insituto Smithsoniano, del 2001 al 2005. Con estos datos, 
construir una gráfica de barras. 


Tabla 1.15 


Año 

2001 

2002 

2003 

2004 

2005 

Cantidad 

32 

26 

24 

20 

24 


1.73 En la tabla 1.16 se presentan las poblaciones de los siete países más poblados del mundo en 1997. Con estos datos, elaborar 
una gráfica de pastel. 


Tabla 1.16 


País 

China 

India 

Estados 

U nidos 

Indonesia 

Brasil 

Rusia 

Pakistán 

Población 

(millones) 

1 222 

968 

268 

210 

165 

148 

132 


Fuente: U.S. Bureau of theCensus, International database. 


1.74 U n diagrama de Pareto es una gráfica de barras ordenadas de mayor a menor, de izquierda a derecha. Con los datos de la 
tabla 1.16, construir un diagrama de Pareto. 


1.75 En la tabla 1.17 se dan las áreas, en millones de millas cuadradas, de los océanos del mundo. Graficar estos datos en una 
gráfica: a) de barras, b) de pastel. 


Tabla 1.17 


Océano 

Pacífico 

Atlántico 

índico 

Antártlco 

Ártico 

Área (millonesde 
millas cuadradas) 

63.8 

31.5 

28.4 

7.6 

4.8 


Fuente: Naciones Unidas. 


ECUACIONES 


1.76 Resolver las ecuaciones siguientes: 


fl) 16 - 5c = 36 
b) 2Y — 6 = 4 — 3Y 


c) 4(X -3) - 11 = 15 -2(X +4) 

d) 3(2/7 + 1) = 5(3 -U) + 3(17 -2) 


e) 3[2(X + 1) — 4] = 10 — 5(4 — 2X) 

f) §(12 + K)=6 — i(9 —K) 


Resolver las siguientes ecuaciones simultáneas: 


d) 2a + b = 10 
la -3b = 9 

b ) 3a + 5b = 24 
2 a + 3b = 14 

c) 8X — 3Y = 2 
3X + 1Y = -9 

d ) 5A -9 B = -10 
3A -4 B = 16 


é) 2a + b — c = 2 
3 a — 4b + 2c = 4 
4a + 3b — 5c = —8 

/) 5X + 2Y + 3Z = -5 
2X - 3Y - 6Z = 1 
X + 5Y - 4Z =22 

g) 3U-5V +6W =7 
5U + 3V -2W = - 1 
4/7 - 8V + \m = 11 


1.77 
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1.78 a) Graficar las ecuaciones 5X + 2Y = 4 y 7X - 3Y = 23 en el mismo conjunto de ejes coordenados. 

b) A partir de la gráfica, determinar la solución de estas dos ecuaciones simultáneas. 

c) Usar los procedimientos de los incisos a) y b ) para obtener las soluciones de las ecuaciones simultáneas a) a d) del 
problema 1.77. 

1.79 a) Usar la gráfica del problema 1.61a) para resolver la ecuación 2X 2 + X - 10 = 0. ( Sugerencia: Encontrar los valores 

deX en los que la parábola cruza el ejeX: es decir, en los que Y vale 0.) 

b ) Emplear el método del inciso a) para resolver 3X 2 - 4X - 5 = 0. 

1.80 Las soluciones de una ecuación cuadrática aX 2 + JbX + c = 0 se obtienen mediante la fórmula cuadrática: 


X = 


—b ± V¿> 2 — 4 ac 

2a 


E mpleando esta fórmula, encontrar las soluciones de: a) 3X 2 - 4X - 5 = 0, b) 2X 2 - X - 10 = 0, c) 5X 2 + 10X = 7 y 

d)X 2 + 8X + 25 = 0. 


DESIGUALDADES 

1.81 Utilizando los símbolos de desigualdad, ordenar los números -4.3, -6.15, 2.37,1.52 y -1.5 en: a) en orden creciente, b ) 
en orden decreciente de magnitud. 


1.82 Usar los símbolos de desigualdad para expresar cada una de las afirmaciones siguientes. 

a) El número N de niños está entre 30 y 50 inclusive. 

b) El número S de puntos en un par de dados no es menor a 7. 

c) X es mayor o igual a-4 y menor que 3. 

d) P vale a lo mucho 5. 

e) X es mayor que y aumentada en 2. 


1.83 Resolver cada una de las desigualdades siguientes: 


a) 

3X > 12 

d ) 

3 + 5(y —2) <7 — 3(4 

b) 

4X < 5X - 3 

e) 

-3 < \{2X + 1) < 3 

c) 

2N + 15 > 10 + 3 N 

/) 

0 <|(15 — 5 N) < 12 


g) — 2 < 3 +1 (a — 12) < 8 


LOGARITMOS Y PROPIEDADES DE LOS LOGARITMOS 

1.84 Encontrar los logaritmos comunes: 

a) log(10) b) log(100) c) log(l 000) d) log(O.l) e) log(0.01) 

1.85 Encontrar los logaritmos naturales de los siguientes números a cuatro lugares decimales: 
a) ln(e) b) ln(10) c) ln(100) d) ln(1 000) e) ln(0.1) 

1.86 Encontrar los logaritmos: 

a) log 4 4 b) log 5 25 c) log 6 216 d) log 7 2 401 e) log 8 32 768 
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1.87 Usar EXCEL para hallar los logaritmos siguientes. Dar la respuesta y los comandos, 
a) log 4 5 b) log 5 24 c) log 6 215 cf) log 7 8 e) log 8 9 

1.88 Repetir el problema 1.87 usando MAPLE.Darla respuesta y los comandos de M A PLE. 

1.89 Emplear las propiedades de los logaritmos para escribir la expresión siguiente en forma de sumas y diferencias de logarit¬ 
mos: ln((a 3 b 4 )/c 5 ) 

1.90 Emplear las propiedades de los logaritmos para escribir la expresión siguiente en forma de sumas y diferencias de logarit¬ 
mos: log((xyz)/w 3 ) 

1.91 Transformar la siguiente expresión en una expresión que contenga un solo logaritmo: 5 ln(a) - 4 In(Jb) + ln(c) + ln(d) 

1.92 Transformar la siguiente expresión en una expresión que contenga un solo logaritmo: log(u) + logM + log(w) - 2 log(x) 

- 3 log(y) - 4 log(z). 

ECUACIONES LOGARÍTMICAS 

1.93 Encontrar la solución de log(3x - 4) = 2 

1.94 Encontrar la solución de ln(3x 2 - x) = ln(10) 

1.95 Encontrar la solución de log(w - 2) - Iog(2w + 7) = log(w + 2) 

1.96 Encontrar la solución de ln(3x + 5) + ln(2x - 5) = 12 

1.97 Usar M A PLE o EXCEL para encontrar la solución de ln(2x) + log(3x - 1) = 10 

1.98 Usar M A PLE o EXCEL para encontrar la solución de log(2x) + ln(3x - 1) = 10 

1.99 Usar M A PLE o EXCEL para encontrar la solución de ln(3x) - log(x) = log 2 3 

1.100 Usar M A PLE o EXCEL para encontrar la solución de log 2 (3x) - log(x) = ln(3) 


Distribuciones 

DE FRECUENCIAS 



DATOS EN BRUTO 

Los datos en bruto son los datos recolectados que aún no se han organizado. Por ejemplo, las estaturas de 100 estu¬ 
diantes tomados de la lista alfabética de una universidad. 

ORDENACIONES 

Ordenación se le llama a los datos numéricos en bruto dispuestos en orden creciente o decreciente de magnitud. A la 
diferencia entre el número mayor y el número menor se le conoce como el rango de los datos. Por ejemplo, si la esta¬ 
tura mayor en los 100 estudiantes es 74 pulgadas (¡n) y la menores 60 ¡n, el rango es 74 - 60 = 14 pulgadas (i n). 

DISTRIBUCIONES DE FRECUENCIA 

Al organizar una gran cantidad de datos en bruto, suele resultar útil distribuirlos en ciases o categorías y determinar 
la cantidad de datos que pertenece a cada clase; esta cantidad se conoce como la frecuencia de clase. A la disposición 
tabular de los datos en clases con sus respectivas frecuencias de clase se le conoce como distribución de frecuencias 
o tabla de frecuencias. La tabla 2.1 es una distribución de frecuencias de las estaturas (registradas a la pulgada más 
cercana) de 100 estudiantes de la universidad XYZ. 


Tabla 2.1 Estaturas de 100 estudiantes 
de la universidad XYZ 


Estatura 

(¡n) 

Cantidad de 
estudiantes 

60-62 

5 

63-65 

18 

66-68 

42 

69-71 

27 

72-74 

8 


Total 100 


La primera clase (o categoría), por ejemplo, consta de las estaturas que van desde 60 hasta 62 pulgadas y queda 
Identificada por el símbolo 60-62. Como hay cinco estudiantes cuyas estaturas pertenecen a esta clase, la frecuencia 
de clase correspondiente es 5. 


37 
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A los datos organizados y resumidos como en la distribución de frecuencias anterior se les llama datos agrupados. 
Aunque al agrupar los datos se pierden muchos de los detalles originales de los datos, esto tiene la ventaja de que se 
obtiene una visión general clara y se hacen evidentes las relaciones. 

INTERVALOS DE CLASE Y LÍM ITES DE CLASE 

AI símbolo que representa una clase, como 60-62 en la tabla 2.1, se le conoce como intervalo de clase. A los números 
délos extremos, 60 y 62, se les conoce como límites de clase; el número menor (60) es el límite Inferior de clase, y el 
número mayor (62) es el límite superior de clase. Los términos clase eintervalo de clase se suelen usar Indistintamen¬ 
te, aunque el Intervalo de clase en realidad es un símbolo para la clase. 

Un Intervalo de clase que, por lo menos teóricamente, no tenga Indicado el límite de clase superior o el límite de 
clase Inferior, se conoce como intervalo de clase abierto. Por ejemplo, al considerar grupos de edades de personas, un 
Intervalo quesea "65 años o mayores" es un Intervalo de clase abierto. 

FRONTERAS DE CLASE 

Si las estaturas se registran a la pulgada más cercana, el Intervalo de clase 60-62 comprende teóricamente todas las 
mediciones desde 59.5000 hasta 62.5000 ¡n. Estos números que se Indican brevemente mediante los números exactos 
59.5 y 62.5 son las fronteras de clase o los límites de clase reales; el menor de los números (59.5) es la frontera infe¬ 
rior de clase y el número mayor (62.5) es la frontera superior de clase. 

En la práctica, las fronteras de clase se obtienen sumando el límite superior de un Intervalo de clase al límite Infe¬ 
rior del Intervalo de clase inmediato superior y dividiendo entre 2. 

Algunas veces, las fronteras de clase se usan para representar a las clases. Por ejemplo, las clases de la tabla 2.1 
pueden Indicarse como 59.5-62.5, 62.5-65.5, etc. Para evitar ambigüedades cuando se usa esta notación, las fronteras 
de clase no deben coincidir con las observaciones. Por lo tanto, si una observación es 62.5, no es posible decidir si 
pertenece al Intervalo 59.5-62.5 o al Intervalo 62.5-65.5 

TAMAÑO O AMPLITUD DE UN INTERVALO DE CLASE 

El tamaño, o la amplitud, de un Intervalo de clase es la diferencia entre sus fronteras superior e Inferior y se le conoce 
también como amplitud de clase, tamaño de clase o longitud de clase. SI en una distribución de frecuencia todos los 
Intervalos de clase tienen la misma amplitud, esta amplitud común se denota c. En este caso, c es Igual a la diferencia 
entredós límites Inferiores de clases sucesivas o entre dos límites superiores de clases sucesivas. Por ejemplo, en los 
datos de la tabla 2.1, el Intervalo de clase es c = 62.5 - 59.5 = 65.5 - 62.5 = 3. 

LA MARCA DE CLASE 

La marca de clase es el punto medio del Intervalo de clase y se obtiene sumando los límites de clase inferior y superior 
y dividiendo entre 2. Así, la marca de clase del Intervalo 60-62 es (60 + 62)/2 = 61. A la marca de clase también se 
le conoce como punto medio de clase. 

Para los análisis matemáticos posteriores, se supone que todas las observaciones que pertenecen a un Intervalo de 
clase dado coinciden con la marca de clase. Así, se considera que todas las estaturas en el Intervalo de clase 60-62 ¡n 
son de 61 ¡n. 

REGLASGENERALESPARAFORMAR UNA 
DISTRIBUCIÓN DE FRECUENCIAS 

1. En el conjunto délos datos en bruto, se determina el número mayor y el número menor y se halla, así, el rango (la 
diferencia entre los números mayor y menor). 
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2. Se divide el rango en una cantidad adecuada de intervalos de clase de una misma amplitud. Si esto no es posible, 
se usan Intervalos de clase de diferentes amplitudes o intervalos de clase abiertos (ver problema 2.12). La cantidad 
de intervalos suele ser de 5 a 20, dependiendo de los datos. Los intervalos de clase también suelen elegirse de 
manera que las marcas de clase (o puntos medios de clase) coincidan con datos observados. Esto tiende a disminuir 
el llamado error de agrupamiento en los análisis matemáticos subsiguientes. En cambio, las fronteras de clase no 
deben coincidir con datos observados. 

3. Se determina la cantidad de observaciones que caen dentro de cada intervalo de clase; es decir, se encuentran las 
frecuencias de clase. La mejor manera de hacer esto es utilizando una hoja deconteo (ver problema 2.8). 

HISTOG RAMAS Y POLÍGONOS DE FRECUENCIAS 

Los histogramas y los polígonos de frecuencias son dos representaciones gráficas de las distribuciones de frecuencias. 

1. Un histograma o histograma de frecuencias consiste en un conjunto de rectángulos que tienen: a) sus bases sobre 
un eje horizontal (el ejeX ), con sus centros coincidiendo con las marcas de clase de longitudes ¡guales a la ampli¬ 
tud del Intervalo de clase, y b) áreas proporcionales a las frecuencias de clase. 

2. U n polígono de frecuencias es una gráfica de línea que presenta las frecuencias de clase graficadas contra las mar¬ 
cas de clase. Se puede obtener conectando los puntos medios de las partes superiores de los rectángulos de un 
histograma. 

En las figuras 2.1 y 2.2 se muestran el histograma y el polígono de frecuencias correspondientes a la distribución 

de frecuencias de las estaturas presentada en la tabla 2.1. 



67 70 

Estatura (in) 

Figura 2-1 MINITAB, histograma que muestra los puntos medios y las frecuencias de clase. 


Obsérvese en la figura 2.2 cómo el polígono de frecuencias se ha anclado por sus extremos, es decir, en 58 y 76. 

DISTRIBUCIONES DE FRECUENCIAS RELATIVAS 

La frecuencia relativa de una clase es la frecuencia de la clase dividida entre la suma de las frecuencias de todas las 
clases y generalmente se expresa como porcentaje. Por ejemplo, en la tabla 2.1, la frecuencia relativa de la clase 66-68 
es 42/100 = 42%. Por supuesto, la suma de las frecuencias relativas de todas las clases es 1, o 100%. 

Si en la tabla 2.1 las frecuencias se sustituyen por frecuencias relativas, la tabla que se obtiene es una distribución 
de frecuencias relativas, distribución porcentual o tabla de frecuencias relativas. 

Las representaciones gráficas de las distribuciones de frecuencias relativas se obtienen a partir de los histogramas 
o polígonos de frecuencias, cambiando únicamente, en la escala vertical, las frecuencias por las frecuencias relativas y 
conservando la gráfica exactamente Igual. A las gráficas que se obtienen se les llama histogramas de frecuencias rela¬ 
tivas (o histogramas porcentuales) y polígonos de frecuencias relativas (o polígonos porcentuales ), respectivamente. 
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DISTRIBUCIONES DE FREC UE NCIAS AC UM UL ADAS Y OJIVAS 

A la suma de todas las frecuencias menores que la frontera superior de un Intervalo de clase dado se le llama frecuen¬ 
cia acumulada hasta ese intervalo de clase Inclusive. Por ejemplo, en la tabla 2.1, la frecuencia acumulada hasta el 
Intervalo de clase 66-68 Inclusive es 5 + 18 + 42 = 65, lo que significa que 65 estudiantes tienen una estatura menor 
a 68.5 in. 



Figura 2-2 MINITAB, polígono de frecuencias de las estaturas de los estudiantes. 

A una tabla en la que se presentan las frecuencias acumuladas se le llama distribución de frecuencias acumuladas, 
tabla de frecuencias acumuladas o simplemente distribución acumulada, y se presenta en la tabla 2.2 para la distribu¬ 
ción de las estaturas de los estudiantes de la tabla 2.1. 


Tabla 2.2 


Estatura (¡n) 

Cantidad de estudiantes 

M enos de 59.5 

0 

M enos de 62.5 

5 

M enos de 65.5 

23 

M enos de 68.5 

65 

M enos de 71.5 

92 

M enos de 74.5 

100 


U na gráfica que muestra las frecuencias acumuladas menores de cada frontera superior de clase respecto a cada 
frontera superior de clase se le conoce como gráfica de frecuencias acumuladas u ojiva. E n algunas ocasiones se desea 
considerar distribuciones de frecuencias mayores o ¡guales que la frontera Inferior de cada Intervalo de clase. Como 
en ese caso se consideran las estaturas de 59.5 ¡n o más, de 62.5 ¡n o más, etc., a estas distribuciones se les suele llamar 
distribuciones acumuladas "o más que" , en tanto que las distribuciones consideradas antes son distribuciones acumu¬ 
ladas " o menos que" . Una puede obtenerse fácil mente de la otra. A las ojivas correspondientes se les llama ojivas “más 
que" y ojivas "menos que”. Aquí, siempre que se hable de distribuciones acumuladas o de ojivas, sin más, se tratará 
del tipo "menos que”. 

DISTRIBUCIONES DE FREC UE NC IAS AC UM UL ADAS 
RELATIVAS Y OJ IVAS PORCENTUALES 

La frecuencia acumulada relativa o frecuencia acumulada porcentual es la frecuencia acumulada dividida entre la 
suma de todas las frecuencias (frecuencia total). Por ejemplo, la frecuencia acumulada relativa de las estaturas meno¬ 
res que 68.5 ¡n es 65/100 = 0.65 o 65%, lo que significa que 65% de los estudiantes tienen estaturas menores a 
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68.5 in. Si en la tabla 2.2 se emplean las frecuencias acumuladas relativas en lugar de las frecuencias acumuladas, se 
obtiene una distribución de frecuencias acumuladas relativas (o distribución acumulada porcentual ) y una gráfica de 
frecuencias acumuladas relativas (u ojiva porcentual ), respectivamente. 

CURVAS DE FRECUENCIAS Y OJ IVAS SUAVIZADAS 

Suele considerarse que los datos recolectados pertenecen a una muestra obtenida de una población grande. Como de 
esta población se pueden obtener muchas observaciones, teóricamente es posible (si son datos continuos) elegir Inter¬ 
valos de clase muy pequeños y, a pesar de eso, tener un número adecuado de observaciones que caigan en cada clase. 
De esta manera, cuando se tienen poblaciones grandes puede esperarse que los polígonos de frecuencias, o los polígo¬ 
nos de frecuencias relativas, correspondientes a estas poblaciones estén formados por una gran cantidad de pequeños 
segmentos de recta de manera que sus formas se aproximen a las de unas curvas, a las cuales se les llama curvas de 
frecuencias o curvas de frecuencias relativas, respectivamente. 

Es razonable esperar que estas curvas teóricas puedan ser aproximadas suavizando los polígonos de frecuencias o 
los polígonos de frecuencias relativas de la muestra; esta aproximación mejorará a medida que aumenta el tamaño de 
la muestra. Ésta es la razón por la que a las curvas de frecuencias se les suele llamar polígonos de frecuencias suavi¬ 
zados. 

De Igual manera, suavizando las gráficas de frecuencias acumuladas u ojivas, se obtienen ojivas suavizadas. Por 
lo general, es más fácil suavizar una ojiva que un polígono de frecuencias. 

TIPOS DE CURVASDE FRECUENCIAS 

Las curvas de frecuencias que surgen en la práctica toman ciertas formas características, como las que se muestran en 
la figura 2-3. 




Figura 2-3 Cuatro distribuciones que se encuentran con por lo común. 

1. Las curvas simétricas o en forma de campana se caracterizan porque las observaciones equidistantes del máximo 
central tienen la misma frecuencia. Las estaturas tanto de hombres como de mujeres adultos tienen distribuciones 
en forma de campana. 

2. Las curvas que tienen colas hacia la Izquierda se dice que son sesgadas a la izquierda. Las curvas de la cantidad 
de años que viven hombres y mujeres son sesgadas a la izquierda. Pocos mueren jóvenes y la mayoría muere entre 
los 60 y los 80 años. En general, las mujeres viven en promedio diez años más que los hombres. 

3. Las curvas que tienen colas hacia la derecha se dice que son sesgadas a la derecha. Las curvas de las edades a las 
que se casan tanto hombres como mujeres son sesgadas a la derecha. La mayoría se casa entre los veinte y treinta 
años y pocos se casan alrededor de cuarenta, cincuenta, sesenta o setenta años. 

4. Las curvas que tienen aproximadamente las mismas frecuencias para todos sus valores se dice que son curvas 
distribuidas uniformemente. Por ejemplo, las máquinas dispensadoras de refresco lo hacen de manera uniforme 
entre 15.9 y 16.1 onzas. 

5. Las curvas de frecuencias en forma dej o en forma deJ inversa son curvas en las que el máximo se presenta en 
uno de sus extremos. 

6. Las curvas de frecuencias en forma de U son curvas que tienen un máximo en cada extremo y un mínimo en medio. 

7. Las curvas bimodales son curvas que tienen dos máximos. 

8. Las curvas muid modales tienen más de dos máximos. 
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PROBLEMAS RESUELTOS 


ORDENACIONES 

2.1 a) Disponer los números 17, 45, 38, 27, 6, 48,11, 57, 34 y 22 en una ordenación. 

b) D etermi nar el rango de estos números. 

SOLUCIÓN 

a) En orden ascendente de magnitud, la ordenación es: 6, 11, 17, 22, 27, 34, 38, 45, 48, 57. En orden descendente de 
magnitud, la ordenación es: 57, 48, 45, 38, 34, 27, 22,17,11, 6. 

b ) Como el número mayor es 57 y el número menor es 6, el rango es 57 - 6 = 51. 

2.2 En la tabla siguiente se presentan las calificaciones finales que obtuvieron en matemática 80 alumnos de una 
universidad. 


68 

84 

75 

82 

68 

90 

62 

88 

76 

93 

73 

79 

88 

73 

60 

93 

71 

59 

85 

75 

61 

65 

75 

87 

74 

62 

95 

78 

63 

72 

66 

78 

82 

75 

94 

77 

69 

74 

68 

60 

96 

78 

89 

61 

75 

95 

60 

79 

83 

71 

79 

62 

67 

97 

78 

85 

76 

65 

71 

75 

65 

80 

73 

57 

88 

78 

62 

76 

53 

74 

86 

67 

73 

81 

72 

63 

76 

75 

85 

77 


De acuerdo con esta tabla, encontrar: 

a) La calificación más alta. 

b) La calificación más baja. 

c) El rango. 

d) Las calificaciones de los cinco mejores estudiantes. 

e) Las calificaciones de los cinco peores estudiantes. 

f) La calificación del alumno que tiene el décimo lugar entre las mejores calificaciones. 

g) El número de estudiantes que obtuvieron 75 o más. 

h) El número de estudiantes que obtuvieron 85 o menos. 

/) El porcentaje de los estudiantes que obtuvieron calificaciones mayores a 65 pero no mayores a 85. 
j) Las calificaciones que no aparecen en esta tabla. 

SOLUCIÓN 

Como algunas de estas preguntas son tan minuciosas, es mejor construir primero una ordenación. Esto se hace dividiendo 
los datos, de manera adecuada, en clases y colocando cada número de la tabla en su clase correspondiente, como se ve en 
la tabla 2.3, llamada tabla de entradas. Después, los números de cada clase se disponen en una ordenación, como se mues¬ 
tra en la tabla 2.4, con lo que se obtiene la ordenación deseada. Consultando la tabla 2.4 es relativamente fácil responder a 
las preguntas anteriores. 

a) La calificación más alta es 97. 

b ) La calificación más baja es 53. 

c) El rango es 97 - 53 = 44 

d) Las calificaciones de los cinco mejores estudiantes son 97, 96, 95, 95 y 94. 
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Tabla 2.3 




e) Las calificaciones de los cinco peores estudiantes son 53, 57, 59, 60 y 60. 

f) La calificación del alumno que tiene el décimo lugar entre las mejores calificaciones es 88. 

g) La cantidad de estudiantes que obtuvieron 75 o más es 44. 

h ) La cantidad de estudiantes que obtuvieron menos de 85 es 63. 

/) El porcentaje de estudiantes que obtuvieron calificaciones mayores a 65 pero no mayores a 85 es 49/80 = 61.2%. 

j) Las calificaciones que no aparecen en esta tabla son desde 0 hasta 52, 54, 55, 56, 58, 64, 70, 91, 92, 98, 99 y 100. 

DISTRIBUCIONES DE FRECUENCIAS, HISTOGRAMAS 
Y POLÍGONOS DE FRECUENCIAS 

2.3 La tabla 2.5 muestra una distribución de frecuencias de los salarios semanales de 65 empleados de la empresa 
P&R. Con los datos de esta tabla, determinar: 

a) El límite inferior de la sexta clase. 

b) El límite superior de la cuarta clase. 

c) La marca de clase (o punto medio de clase) de la tercera clase. 

d) Las fronteras de clase de la quinta clase. 

e) La amplitud del intervalo de la quinta clase. 

f) La frecuencia de la tercera clase. 

g) La frecuencia relativa de la tercera clase. 

h) El Intervalo de clase de mayor frecuencia. A este Intervalo se le suele llamar intervalo de clase modal y a 
su frecuencia se le conoce como frecuencia de la clase modal. 
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Tabla 2.5 


Salarlos 

Número de 
empleados 

$250.00- $259.99 

8 

$260.00- $269.99 

10 

$270.00- $279.99 

16 

$280.00- $289.99 

14 

$290.00- $299.99 

10 

$300.00- $309.99 

5 

$310.00-$319.99 

2 


Total 65 


/) El porcentaje de empleados que gana menos de $280.00 por semana. 

j) El porcentaje de empleados que gana menos de $300.00 por semana, pero por lo menos $260.00 por 
semana. 

SOLUCIÓN 

a) $300.00. 

b) $289.99. 

c) La marca de clase (o punto medio de clase) de la tercera clase = ¿($270.00 + $279.99) = $274.995. Para propósitos 
prácticos, esta cantidad se redondea a $275.00. 

d) La frontera Inferior de la quinta clase = ^($290.00 + $289.99) = $289.995. La frontera superior de la quinta clase 
= ±($299.99 + $300.00) = $299.995. 

e) La amplitud del intervalo de la quinta clase = frontera superior de la quinta clase - frontera inferior de la quinta clase 
= $299.995 - $289.985 = $10.00. En este caso, todos los intervalos de clase son del mismo tamaño: $10.00. 

f) 16. 

g) 16/65 = 0.246 = 24.6%. 

h) $270.00 — $279.99. 

/) El número total de empleados que gana menos de $280 por semana = 16 + 10 + 8 = 34. El porcentaje de empleados 
que gana menos de $280 por semana = 34/65 = 52.3%. 

j) El número de empleados que gana menos de $300 por semana pero más de $260 por semana = 10 + 14 + 16 + 10 
= 50. El porcentaje de empleados que gana menos de $300 por semana, pero por lo menos $260 por semana = 50/65 
= 76.9%. 

2.4 SI las marcas de clase en una distribución de frecuencias de pesos de estudiantes son 128,137,146,155,164, 

173 y 182 libras, encuentre: a) la amplitud del Intervalo de clase, b) las fronteras de clase y c) los límites de 

clase, suponiendo que los pesos se hayan redondeado a la libra más cercana. 

SOLUCIÓN 

a) La amplitud del intervalo de clase = diferencia entre marcas sucesivas de clase = 137 - 128 = 146 - 137 = etc. = 
91b. 

b ) Como todos los intervalos de clase tienen la misma amplitud, las fronteras de clase están a medio camino entre dos 
marcas de clase y por lo tanto se tienen los valores 


7(128 + 137),i(137+ 146),...,1(173 + 182) o bien 


132.5, 141.5,150.5,..., 177,5 Ib 
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La frontera de la primera clase es 132.5 - 9 = 123.5 y la frontera de la última clase es 177.5 + 9 = 186.5, ya 
que la amplitud común de los intervalos de clase es 9 Ib. Por lo tanto, todas las fronteras de clase son: 

123.5,132.5,141.5,150.5,159.5,168.5,177.5,186.5 Ib 

c) Como los límites de el ase son enteros, se eligen éstos como los enteros más cercanos a las fronteras de clase, es decir, 
123,124,132,133,141,142... Así, los límites de la primera clase son 124-132, de la siguiente, 133-141, etcétera. 

2.5 Se toma una muestra de la cantidad de tiempo, en horas por semana, que los estudiantes universitarios usan su 
celular. Usando SPSS, la secuencia "Analyze=> DescripiveStatistics=> Frequencies” da el resultado mos¬ 
trado en la figura 2-4. 


Tiempo 



Frecuencias 

Porcentajes 

Porcentajes válidos 

Porcentajes 

acumulados 

Válido 3.00 

3 

6.0 

6.0 

6.0 

4.00 

3 

6.0 

6.0 

12.0 

5.00 

5 

10.0 

10.0 

22.0 

6.00 

3 

6.0 

6.0 

28.0 

7.00 

4 

8.0 

8.0 

36.0 

8.00 

4 

8.0 

8.0 

44.0 

9.00 

3 

6.0 

6.0 

50.0 

10.00 

4 

8.0 

8.0 

58.0 

11.00 

2 

4.0 

4.0 

62.0 

12.00 

2 

4.0 

4.0 

66.0 

13.00 

3 

6.0 

6.0 

72.0 

14.00 

1 

2.0 

2.0 

74.0 

15.00 

2 

4.0 

4.0 

78.0 

16.00 

5 

10.0 

10.0 

88.0 

17.00 

2 

4.0 

4.0 

92.0 

18.00 

1 

2.0 

2.0 

94.0 

19.00 

2 

4.0 

4.0 

98.0 

20.00 

1 

2.0 

2.0 

100.0 

Total 

50 

100.0 

100.0 



Figura 2-4 SPSS, resultados para el problema 2.5. 


a) ¿Qué porcentaje usa su celular 15 o menos horas por semana? 

b) ¿Qué porcentaje usa su celular 10 o más horas por semana? 

SOLUCIÓN 

a) El porcentaje acumulado correspondiente a 15 horas es 78%. Es decir, 78% usa su celular 15 horas o menos por 
semana. 

b ) El porcentaje acumulado correspondiente a 10 horas es 58%. Es decir, 58% usa su celular 10 horas o menos por sema¬ 
na. Por lo tanto, 42% usa su celular más de 10 horas por semana. 

2.6 De 150 mediciones, la menor es 5.18 ¡n y la mayor es 7.44 ¡n. Determinar un conjunto adecuado: a) de Inter¬ 
valos de clase, b) de fronteras de el ase y c) de marcas de clase que se pueda usar para elaborar una distribución 
de frecuencias con estas mediciones. 

SOLUCIÓN 

El rango es 7.44 - 5.18 = 226 in. Para un mínimo de cinco intervalos de clases, la amplitud del intervalo de clase es 
2.26/5 = 0.45, aproximadamente, y para un máximo de 20 intervalos de clase, la amplitud del intervalo de clase es 2.26/20 
= 0.11, aproximadamente. Las amplitudes adecuadas para el intervalo de clase, entre 0.11 y 0.45, podrían ser 0.20, 
0.30 o 0.40. 
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a) En las columnas I, II y III de la tabla siguiente se presentan intervalos de clase de amplitud 0.20, 0.30 y 0.40, respec¬ 
tivamente. 


I 

II 

III 

5.10-5.29 

5.10-5.39 

5.10-5.49 

5.30-5.49 

5.40-5.69 

5.50-5.89 

5.50-5.69 

5.70-5.99 

5.90-6.29 

5.70-5.89 

6.00-6.29 

6.30-6.69 

5.90-6.09 

6.30-6.59 

6.70-7.09 

6.10-6.29 

6.60-6.89 

7.10-7.49 

6.30-6.49 

6.90-7.19 


6.50-6.69 

7.20-7.49 



6.70-6.89 

6.90-7.09 

7.10-7.29 

7.30-7.49 


Obsérvese que el límite Inferior de cada una de las primeras clases puede ser también distinto a 5.10. Por ejemplo, si 
en la columna I se empieza con 5.15 como límite Inferior, el primer intervalo de clase será 5.15-5.34. 

b) Las fronteras de clase correspondientes a las columnas I, II y III del Inciso a) son: 


1 5.095-5.295, 5.295-5.495, 5.495-5.695,..., 7.295-7.495 

II 5.095-5.395, 5.395-5.695, 5.695-5.995,..., 7.195-7.495 
III 5.095-5.495, 5.495-5.895, 5.895-6.295,..., 7.095-7.495 

Obsérvese que estas fronteras de clase son adecuadas, ya que no coinciden con las mediciones observadas, 

c) A continuación se dan las marcas de clase correspondientes a las columnas I, II y III del inciso a). 

I 5.195, 5.395,..., 7.395 II 5.245, 5.545,..., 7.345 III 5.295, 5.695,..., 7.295 

Estas marcas de clase tienen la desventaja de no coincidir con mediciones observadas 

2.7 Al resolver el problema 2.6a), un estudiante elige como Intervalos de clase 5.10-5.40, 5.40-5.70,..., 6.90-7.20 
y 7.20-7.50. ¿Hay algún problema con esta elección? 


SOLUCIÓN 

Estos intervalos de clase se traslapan en 5.40, 5.70,..., 7.20. De esta manera, una medición que se registre, por ejemplo 
como 5.40, podrá colocarse en cualquiera de los dos primeros intervalos de clases. Algunos justifican esto acordando colo¬ 
car la mitad de los casos ambiguos en una de las clases y la otra mitad en la otra. 

Esta ambigüedad se elimina escribiendo los intervalos de clase como de 5.10 hasta menos de 5.40, de 5.40 hasta 
menos de 5.70, etc. En este caso, los límites de clase coinciden con las fronteras de clase y las marcas de clase pueden 
coincidir con datos observados. 

En general, siempre que sea posible, se desea evitar que los Intervalos de clase se superpongan y escogerlos de 
manera que las fronteras de clase sean valores que no coincidan con datos observados. Por ejemplo, los intervalos de clase 
del problema 2.6 pueden ser 5.095-5.395, 5.395-5.695, etc., sin que haya ambigüedad. La desventaja de este caso particu¬ 
lar es que las marcas de clase no coincidirán con datos observados. 
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2.8 E n la tabla siguiente se presentan los pesos, dados a la libra más cercana, de 40 estudiantes de una universidad. 
Elaborar una distribución de frecuencias. 


138 

164 

150 

132 

144 

125 

149 

157 

146 

158 

140 

147 

136 

148 

152 

144 

168 

126 

138 

176 

163 

119 

154 

165 

146 

173 

142 

147 

135 

153 

140 

135 

161 

145 

135 

142 

150 

156 

145 

128 


SOLUCIÓN 

El peso mayor es 176 Ib y el peso menor es 119 Ib, de manera que el rango es 176 - 119 = 57 Ib. Si se emplean cinco 
intervalos de clase, la amplitud del Intervalo de clase será 57/5 = 11, aproximadamente; si se usan 20 intervalos de clase, 
la amplitud de cada Intervalo de clase será 57/20 = 3, aproximadamente. 

U na amplitud adecuada para los intervalos de clase es 5 Ib. También es conveniente que las marcas de clase sean 
120,125,130,135,..., Ib. Por lo tanto, los intervalos de clase serán 118-122,123-127,128-132,... Y entonces las fronte¬ 
ras de clase serán 117.5,122.5,127.5,..., las cuales no coinciden con datos observados. 

La distribución de frecuencias buscada se muestra en la tabla 2.6. La columna central, llamada hoja de conteo, se 
usa para tabular las frecuencias de clase a partir de los datos en bruto y suele omitirse en la presentación final de una dis¬ 
tribución de frecuencias. N o es necesario hacer una ordenación, pero si se cuenta con ella, se puede usar para tabular las 
frecuencias. 

Otro método 

Por supuesto, hay otras posibles distribuciones de frecuencias. En la tabla 7.2, por ejemplo, se muestra una distribución de 
frecuencias que tiene sólo siete clases y en la que el Intervalo de clase es de 9 Ib. 


Tabla 2.6 


Peso (Ib) 

Conteo 

Frecuencias 

118-122 

/ 

1 

123-127 

// 

2 

128-132 

// 

2 

133-137 

lili 

4 

138-142 

#/ 

6 

143-147 

HHIII 

8 

148-152 

nn 

5 

153-157 

nn 

4 

158-162 

n 

2 

163-167 

m 

3 

168-172 

/ 

1 

173-177 

n 

2 


Total 40 


Tabla 2.7 


Peso (Ib) 

Conteo 

Frecuencias 

118-126 

III 

3 

127-135 

nn 

5 

136-144 

nn nn 

9 

145-153 

nn nn n 

12 

154-162 

nn 

5 

163-171 

nn 

4 

172-180 

n 

2 


Total 40 


2.9 Se toman las estaturas de 45 estudiantes del sexo femenino de una universidad; a continuación se presentan 
estas estaturas registradas a la pulgada más cercana. Para elaborar un hlstograma, usar el paquete STATIST IX 
para estadística. 


67 

67 

64 

64 

74 

61 

68 

71 

69 

61 

65 

64 

62 

63 

59 

70 

66 

66 

63 

59 

64 

67 

70 

65 

66 

66 

56 

65 

67 

69 

64 

67 

68 

67 

67 

65 

74 

64 

62 

68 

65 

65 

65 

66 

67 
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SOLUCIÓN 

Después de ingresar los datos en la hoja de cálculo de STATISTIX, la secuencia "Statistics => Summary Statistics => 
Histogram" produce el histograma que se muestra en la figura 2-5. 


B 


27 - 


18 - 


9 - 


0 


55 59 63 67 71 75 

Estatura (in) 


Figura 2-5 STATISTIX, histograma de las estaturas de 45 estudiantes universitarias. 


2.10 En la tabla 2.8 sedan las distancias, en millas, que recorren 50 estudiantes del M etropol¡tan Collegedesu casa 
a la universidad. 


Tabla 2.8 Distancias al M etropolitan C ollege (millas) 


4.3 

7.0 

8.0 

3.9 

3.7 

8.4 

2.6 

1.0 

15.7 

3.9 

6.5 

8.7 

0.9 

0.9 

12.6 

4.0 

10.3 

10.0 

6.2 

1.1 

7.2 

8.8 

7.8 

4.9 

2.0 

3.0 

4.2 

3.3 

4.8 

4.4 

7.7 

2.4 

8.0 

8.0 

4.6 

1.4 

2.2 

1.9 

3.2 

4.8 

5.0 

10.3 

12.3 

3.8 

3.8 

6.6 

2.0 

1.6 

4.4 

4.3 


En la figura 2.6 se muestra el histograma obtenido con SPSS con las distancias de la tabla 2.8. Obsérvese que 
las clases son 0 a 2, 2 a 4, 4 a 6, 6 a 8, 8 a 10, 10 a 12, 12 a 14 y 14 a 16. Las frecuencias 7,13, 11, 7, 6, 3, 2 y 
1. Un número que cae en el límite Inferior de el ase se cuenta dentro deesa clase, pero los que caen en el límite 
superior, se cuentan dentro de la clase siguiente. 

a) ¿Cuáles son los valores que pertenecen a la primera clase? 

b) ¿C uáles son los valores que pertenecen a la segunda clase? 

c) ¿Cuáles son los valores que pertenecen a la tercera clase? 

d) ¿C uáles son los valores que pertenecen a la cuarta clase? 

e) ¿Cuáles son los valores que pertenecen a la quinta clase? 

f) ¿Cuáles son los valores que pertenecen a la sexta clase? 

g) ¿Cuáles son los valores que pertenecen a la séptima clase? 

h) ¿Cuáles son los valores que pertenecen a la octava clase? 
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Distancia (millas) 


Figura 2-6 SPSS, histograma de las distancias al Metropolitan College. 


SOLUCIÓN 

a) 0.9, 0.9, 1.0, 1.1, 1.4, 1.6, 1.9 

b) 2.0, 2.0, 2.2, 2.4, 2.6, 3.0, 3.2, 3.3, 3.7, 3.8, 3.8, 3.9, 3.9 
C) 4.0, 4.2, 4.3, 4.3, 4.4, 4.4, 4.6, 4.8, 4.8, 4.9, 5.0 

d) 6.2, 6.5, 6.6, 7.0, 7.2, 7.7, 7.8 

e) 8.0, 8.0, 8.0, 8.4, 8.7, 8.8 
O 10.0, 10.3, 10.3 

g) 12.3, 12.6 

h) 15.7 

2.11 En la figura 2-7 se muestra un histograma obtenido con SAS, con las distancias de la tabla 2.8. Se muestran los 
puntos medios (marcas de clase) de los Intervalos de clase. Las clases son 0 a 2.5, 2.5 a 5.0, 5.0 a 7.5, 7.5 a 
10.0, 10 a 12.5, 12.5 a 15.0, 15.0 a 17.5, 17.5 a 20.0. Los números que caen en el límite Inferior de clase se 
cuentan dentro de esa clase, pero si caen en el límite superior se cuentan dentro de la clase siguiente. 

a) ¿Cuáles son los valores (de la tabla 2.8) que pertenecen a la primera clase? 

b) ¿Cuáles son los valores que pertenecen a la segunda clase? 

c) ¿Cuáles son los valores que pertenecen a la tercera clase? 

d) ¿Cuáles son los valores que pertenecen a la cuarta clase? 

e) ¿Cuáles son los valores que pertenecen a la quinta clase? 

f) ¿Cuáles son los valores que pertenecen a la sexta clase? 

g) ¿Cuáles son los valores que pertenecen a la séptima clase? 

SOLUCIÓN 

a) 0.9, 0.9, 1.0, 1.1, 1.4, 1.6, 1.9, 2.0, 2.0, 2.2, 2.4 

b) 2.6, 3.0, 3.2, 3.3, 3.7, 3.8, 3.8, 3.9, 3.9, 4.0, 4.2, 4.3, 4.3, 4.4, 4.4, 4.6, 4.8, 4.8, 4.9 
C) 5.0, 6.2, 6.5, 6.6, 7.0, 7.2 

d) 7.7, 7.8, 8.0, 8.0, 8.0, 8.4, 8.7, 8.8 
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Distancia (millas) 

Figura 2-7 SAS, histograma con las distancias al Metropolitan College. 


e) 10.0,10.3,10.3,12.3 

f) 12.6 

g) 15.7 

2.12 La empresa P&R (problema 2.3) contrata cinco empleados nuevos, cuyos salarios semanales son $285.34, 
$316.83, $335.78, $356.21 y $374.50. Construir una distribución de frecuencias con los salarlos de los 70 
empleados. 

SOLUCIÓN 

En las tablas 2.9, a) y b), se presentan varias distribuciones de frecuencias posibles. 

Tabla 2.9a) Tabla 2.9 b) 


Salarlos 

Frecuencias 

$250.00-$259.99 

8 

260.00-269.99 

10 

270.00-279.99 

16 

280.00-289.99 

15 

290.00-299.99 

10 

300.00-309.99 

5 

310.00-319.99 

3 

320.00-329.99 

0 

330.00-339.99 

1 

340.00-349.99 

0 

350.00-359.99 

1 

360.00-369.99 

0 

370.00-379.99 

1 


Total 70 


Salarlos 

Frecuencias 

$250.00-$259.99 

8 

260.00-269.99 

10 

270.00-279.99 

16 

280.00-289.99 

15 

290.00-299.99 

10 

300.00-309.99 

5 

310.00-319.99 

3 

320.00 y más 

3 


Total 70 
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Tabla 2.9c) Tabla 2.9d) 


Salarlos 

Frecuencias 

$250.00-$269.99 

18 

270.00-289.99 

31 

290.00-309.99 

15 

310.00-329.99 

3 

330.00-349.99 

1 

350.00-369.99 

1 

370.00-389.99 

1 


Total 70 


Salarlos 

Frecuencias 

$250.00-$259.99 

8 

260.00-269.99 

10 

270.00-279.99 

16 

280.00-289.99 

15 

290.00-299.99 

10 

300.00-319.99 

8 

320.00-379.99 

3 


Total 70 


En la tabla 2.9a) se conserva una misma amplitud de intervalo de clase, $10.00. Esto da por resultado que haya 
demasiadas clases vacías y que sea demasiado detallada en la parte superior de la escala de los salarios. 

En la tabla 2.9 b) se han evitado las clases vacías y el excesivo detalle empleando el intervalo abierto "$320 y más". 
La desventaja es que esta tabla no es útil para realizar ciertos cálculos matemáticos. Por ejemplo, no se puede determinar 
cuál es la cantidad total pagada como salarios semanal mente, ya que en "más de $320.00" puede haber individuos que ganen 
hasta $1 400.00 por semana. 

En la tabla 2.9c) se emplea $20.00 como amplitud del intervalo de clase. La desventaja es que en el extremo inferior 
de la escala desalarlos se pierde mucha información, en tanto que en el extremo superior de la escala, la tabla sigue siendo 
demasiado detallada. 

En la tabla 2.9 d) se emplean amplitudes desiguales de Intervalos de clase. La desventaja es que se complican ciertos 
cálculos que puede desearse hacer después, lo que no ocurre cuando los intervalos de clase son de la misma amplitud. 
También, cuanto mayor sea la amplitud del Intervalo de clase, mayor será el error de agrupamiento. 

2.13 En la figura 2-8 se muestra un histograma, obtenido con EXCEL, con las distancias de la tabla 2.8. Las clases 
son 0 a 3, 3 a 6, 6 a 9, 9 a 12,12 a 15 y 15 a 18. Los números que caigan en el límite superior de clase se cuen¬ 
tan dentro de esa clase, pero si caen en el límite inferior se cuentan dentro de la clase anterior. 

a) ¿Cuáles son los valores (de la tabla 2.8) que pertenecen a la primera clase? 

b) ¿Cuáles son los valores que pertenecen a la segunda clase? 

c) ¿Cuáles son los valores que pertenecen a la tercera clase? 



Distancia (millas) 

Figura 2-8 EXCEL, histograma con las distancias al Metropolitan College. 
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d) ¿Cuáles son los valores que pertenecen a la cuarta clase? 

e) ¿Cuáles son los valores que pertenecen a la quinta clase? 

f) ¿Cuáles son los valores que pertenecen a la sexta clase? 

SOLUCIÓN 

a) 0.9, 0.9, 1.0, 1.1, 1.4, 1.6, 1.9, 2.0, 2.0, 2.2, 2.4, 2.6, 

b) 3.2, 3.3, 3.7, 3.8, 3.8, 3.9, 3.9, 4.0, 4.2, 4.3, 4.3, 4.4, 

C) 6.2, 6.5, 6.6, 7.0, 7.2, 7.7, 7.8, 8.0, 8.0, 8.0, 8.4, 8.7, 

d) 10.0, 10.3, 10.3 

e) 12.3, 12.6 

f) 15.7 


DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS Y OJIVAS 

2.14 A partir de la distribución de frecuencias dada en la tabla 2.5 del problema 2.3, construir: a) una distribución 
de frecuencias acumuladas, b) una distribución acumulada porcentual, c) una ojiva y d) una ojiva porcentual. 


3.0 

4.4, 4.6, 4.8, 4.8, 4.9, 5.0 
8.8 


Tabla 2.10 


Salarios 

Frecuencias 

acumuladas 

Distribución 

acumulada 

porcentual 

M enos de $250.00 

0 

0.0 

M enos de $260.00 

8 

12.3 

M enos de $270.00 

18 

27.7 

M enos de $280.00 

34 

52.3 

M enos de $290.00 

48 

73.8 

M enos de $300.00 

58 

89.2 

M enos de $310.00 

63 

96.9 

M enos de $320.00 

65 

100.0 


SOLUCIÓN 

a) y b) En la tabla 2.10 se muestran la distribución de frecuencias acumuladas y la distribución de frecuencia porcentual (o 
distribución de frecuencias acumuladas relativas). 

Obsérvese que las entradas de la columna 2 se obtienen sumando las entradas sucesivas de la columna 2 de la tabla 
2.5, así, 18 = 8 + 10, 34 = 8 + 10 + 16, etcétera. 

Las entradas de la columna 3 se obtienen dividiendo cada una de las entradas de la columna anterior entre 65, la suma 
de todas las frecuencias, y expresando el resultado como porcentaje. Así, 34/65 = 0.523, o 52.3%. Las entradas en esta 
columna también pueden obtenerse añadiendo entradas sucesivas de la columna 2 de la tabla 2.8. Así, 27.7 = 12.3 + 15.4, 
52.3 = 12.3 + 15.4 + 24.6, etcétera. 

c) y d) En la figura 2-9a) se muestra la ojiva (gráfica de frecuencias acumuladas porcentuales), y en la figura 2-9 b) 
se presenta la ojiva porcentual (gráfica de frecuencias acumuladas relativas). Ambas son gráficas generadas con M initab. 
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b) Salarios 

250 260 270 280 290 300 310 320 



a) Salarios 


Figura 2-9 MINITAB, a) gráfica de frecuencias acumuladas y b) gráfica de frecuencias acumuladas porcentuales. 

2.15 A partir de la distribución de frecuencias dada en la tabla 2.5 del problema 2.3, construir: a) una distribución 
de frecuencias "o más" y b) una ojiva "o más". 

SOLUCIÓN 

a) En la tabla 2.11, obsérvese que cada entrada de la columna 2 se obtiene sumando las entradas sucesivas de la columna 
2 de la tabla 2.5, empezando en la parte inferior de la tabla 2.5; así, 7 = 2 + 5,17 = 2 + 5 + 10, etc. Estas entradas 
también pueden obtenerse restando las entradas en la columna 2 de la tabla 2.10 del total de las frecuencias, 65; así, 
57 = 65 - 8, 47 = 65 - 18, etcétera. 

b) En la figura 2.10 se muestra la ojiva "o más". 


Tabla 2.11 


Salarios 

Frecuencias acumuladas 
"o más" 

$250.00 o más 

65 

$260.00 o más 

57 

$270.00 o más 

47 

$280.00 o más 

31 

$290.00 o más 

17 

$300.00 o más 

7 

$310.00 o más 

2 

$320.00 o más 

0 


2.16 A partir de las ojivas de las figuras 2-9 y 2-10 (problemas 2.14 y 2.15, respectivamente), estimar la cantidad de 
empleados que ganan: a) menos de $288.00 por semana, b ) $296.00 o más por semana, c) por lo menos $263.00 
por semana, pero menos de $275.00 por semana. 

SOLUCIÓN 

a) En la ojiva "menos de" de la figura 2-9 se traza una recta vertical que cruce la recta de los salarios en $288.00. Este 
punto cruza la ojiva en un punto cuyas coordenadas son (288, 45); por lo tanto, la cantidad de empleados que gana 
menos de $288.00 por semana es 45. 

b) En la ojiva "o más" de la figura 2-10 se traza una recta vertical en $296.00. Esta recta cruza la ojiva en el punto (296, 
11); por lo tanto, la cantidad de empleados que gana $296.00 o más por semana es 11 empleados. 
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Salarios 

Figura 2-10 EXCEL, gráfica de frecuencias acumuladas "o más" 


Esto también puede obtenerse a partir de la ojiva "menos de" de la figura 2-9. Trazando una recta en $296.00, 
se encuentra que 54 empleados ganan menos de $296.00 por semana; por lo tanto, 65 - 54 = 11 empleados ganan 
$296.00 o más por semana. 

c) Utilizando la ojiva "menos de" de la figura 2-9, se tiene: cantidad de empleados buscada = cantidad de empleados que 
gana menos de $275.00 por semana - cantidad de empleados que gana menos de $263.00 por semana = 26-11 
= 15. 

Obsérvese que los resultados anteriores también pueden obtenerse mediante interpolación en la tabla de fre¬ 
cuencias acumuladas. Para el inciso a), por ejemplo, ya que $288.00 está a 8/10 o 4/5 entre $280.00 y $290.00, la 
cantidad de empleados buscada debe estar a 4/5 entre 34 y 48 (ver tabla 2.10). Y 4/5 entre 34 y 48 es 4/5(48 - 34) 
= 11. Por lo tanto, el número de empleados buscado es 3 + 11 = 45. 

2.17 Se lanzan cinco monedas 1 000 veces y en cada lanzamiento se anota el número de caras que se obtiene. En la 

tabla 2.12 se muestran la cantidades 0,1, 2, 3, 4 y 5 de caras que se obtuvieron. 

a) G raficar los datos de la tabla 2.12. 

b) Elaborar una tabla en la que se dé el porcentaje de los lanzamientos en los que se obtuvo menos de 0,1, 2, 
3, 4, 5 y 6 caras. 

c) Graficar los datos de la tabla del inciso b). 


Tabla 2.12 


Cantidad de caras 

Cantidad de lanzamientos 
(frecuencias) 

0 

38 

1 

144 

2 

342 

3 

287 

4 

164 

5 

25 


Total 1000 
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SOLUCIÓN 

a) Estos datos se pueden mostrar gráficamente, ya sea como en la figura 2-11 o como en la figura 2-12. 

AI parecer es más natural usar la figura 2-11, ya que la cantidad de caras no puede ser, por ejemplo, 1.5 o 3.2. 
A esta gráfica se le llama gráfica de puntos y se usa cuando los datos son discretos. 



Cada símbolo (punto) representa hasta 9 observaciones. 

Figura 2-11 MINITAB, gráfica de puntos con la cantidad de caras. 



Caras 


Figura 2-12 M INITAB, histograma déla cantidad decaras. 


En la figura 2-12 se presenta un histograma de los datos. Obsérvese que toda el área del histograma correspon¬ 
de a la frecuencia total, 1 000, como debe ser. Cuando se usa un histograma o el correspondiente polígono de frecuen¬ 
cias, se está tratando a los datos como si fueran continuos. Esto, como se verá más tarde, resulta útil. Obsérvese que 
ya en el problema 2.10 se usó un histograma y un polígono de frecuencias para datos discretos. 

b ) La tabla 2.13 es la requerida. Obsérvese que en esta tabla simplemente se da una distribución de las frecuencias acu¬ 
muladas y una distribución de las frecuencias acumuladas porcentuales de la cantidad de caras. Hay que notar que las 
entradas "M enor de 1", "M enor de 2", etc., también podrían haber sido "M enor o igual a 0", "M enor o Igual a 1", 
etcétera. 

c) La gráfica pedida se puede representar como en la figura 2-13 o la figura 2-14. 

La figura 2-13 es más natural para representar datos discretos, ya que el porcentaje de lanzamientos en el que 
se obtienen dos caras es Igual al porcentaje en el que habrá menos de 1.75,1.56 o 1.23 caras, es decir, es un mismo 
porcentaje (18.2%) el que corresponde a todos estos valores (lo que se indica por la línea horizontal). 
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Tabla 2.13 


Número de caras 

Número de lanzamientos 
(frecuencias acumuladas) 

Cantidades porcentuales 
de lanzamientos 
(frecuencias acumuladas 
porcentuales) 

M enos de 0 

0 

0.0 

M enos de 1 

38 

3.8 

M enos de 2 

182 

18.2 

M enos de 3 

524 

52.4 

M enos de 4 

811 

81.1 

M enos de 5 

975 

97.5 

M enos de 6 

1000 

100.0 


En la figura 2-14 se presenta la gráfica de frecuencias acumuladas, u ojiva; los datos se tratan como si fueran 
continuos. 

Obsérvese que las figuras 2-13 y 2-14 corresponden, respectivamente, a las figuras 2-11 y 2-12 del inciso a). 


100 - 



0 1 2 3 4 5 6 7 

Caras 

Figura 2-13 MINITAB, función escalonada. 



Figura 2-14 M INITAB, gráfica de frecuencias acumuladas. 
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CURVAS DE FRECUENCIAS Y OJ IVAS SUAVIZADAS 

2.18 Las muestras de poblaciones tienen histogramasy polígonos de frecuencias con ciertas formas. Si lasmuestras 
son muy grandes, los histogramasy los polígonos defrecuencias se aproximan a la distribución de la población. 
Considérense dos distribuciones de frecuencias poblacionales. a) Considérese una máquina que llena unifor¬ 
memente envases de refresco con una cantidad entre 15.9 y 16.1 onzas. Trazar la curva de frecuencias y deter¬ 
minar qué porcentaje de los envases tiene más de 15.95 onzas, b) Considérense estaturas de mujeres. Estas 
estaturas tienen una distribución de frecuencias poblacional que es simétrica o en forma de campana, en laque 
el promedio es igual a 65 in y la desviación estándar es igual a 3 in. (La desviación estándar se estudia en un 
capítulo posterior.) ¿Qué porcentaje de las estaturas se encuentran entre 62 y 68 in, es decir, están a no más de 
una desviación estándar de la media? ¿Qué porcentaje se encuentra a no más de dos desviaciones estándar de 
la media? ¿Qué porcentaje se encuentra a no más de tres desviaciones estándar de la media? 

SOLUCIÓN 

En la figura 2-15 se muestra una curva de frecuencias uniforme. La región sombreada corresponde a los envases con más 
de 15.95 onzas. Obsérvese que la región abarcada por la curva de frecuencias tiene forma de rectángulo. El área bajo la 
curva de frecuencias está dada por largo x ancho, es decir (16.10 - 15.90) x 5 = 1. El área de la región sombreada es 
(16.10 - 15.95) x 5 = 0.75. Esto se interpreta como que 75% de los envases llenados tiene más de 15.95 onzas. 

En la figura 2-16 se muestra una curva de frecuencias en forma de campana o simétrica. En esta figura se muestran 
en una región sombreada las estaturas a no más de una desviación estándar. Para calcular esta área es necesario hacer uso 



15.90 15.95 16.00 16.05 16.10 

L leño (onzas) 

Figura 2-15 M INITAB, curva de frecuencias uniforme que muestra llenado a más de 15.95 onzas. 



Altura (in) 

Figura 2-16 M INITAB, curva de frecuencias en forma decampana quemuestra la altura 

entre 62 y 68 in y sus frecuencias. 
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del cálculo. El área comprendida a no más de una desviación estándar es aproximadamente 68% de toda el área bajo la 
curva. El área a no más de dos desviaciones estándar es aproximadamente 95% de toda el área bajo la curva. El área a no 
más de tres desviaciones estándar es aproximadamente 99.7% de toda el área bajo la curva. 

En capítulos posteriores se verá más acerca de cómo encontrar áreas bajo estas curvas. 


PROBLEMAS SUPLEMENTARIOS 

2.19 a) Disponga los números 12, 56, 42, 21, 5,18,10, 3, 61, 34, 65 y 24 en una ordenación, y b ) determine el rango. 

2.20 En la tabla 2.14 se presenta una distribución de frecuencias de la cantidad de minutos por semana que ven televisión 400 
estudiantes. De acuerdo con esta tabla, determinar: 

a) El límite superior de la quinta clase. 

b) El límite Inferior de la octava clase. 

c) La marca de clase de la séptima clase, 
cf) Las fronteras de clase de la última clase. 

e) El tamaño del intervalo de clase. 

f) La frecuencia de la cuarta clase. 

g) La frecuencia relativa de la sexta clase. 

h) El porcentaje de estudiantes que no ven televisión más de 600 minutos por semana. 

/) El porcentaje de estudiantes que ven televisión 900 o más minutos por semana. 

¡) El porcentaje de estudiantes que ven televisión por lo menos 500 minutos por semana, pero menos de 1 000 minutos 

por semana. 


Tabla 2.14 


Tiempo 

(minutos) 

Número de 
estudiantes 

300-399 

14 

400-499 

46 

500-599 

58 

600-699 

76 

700-799 

68 

800-899 

62 

900-999 

48 

1 000-1 099 

22 

1 100-1 199 

6 


2.21 Elaborar: a) un histograma y b) un polígono de frecuencias para la distribución de frecuencias de la tabla 2.14. 

2.22 Con los datos de la tabla 2.14 del problema 2.20, construir: a) una distribución de frecuencias relativas, b ) un histograma 
de frecuencias relativas y c) un polígono de frecuencias relativas. 
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2.23 Con los datos de la tabla 2.14, construir: a) una distribución de frecuencias acumuladas, b ) una distribución acumulada 
porcentual, c) una ojiva y d) una ojiva porcentual. (Obsérvese que a menos que se especifique otra cosa, una distribución 
acumulada es del tipo "menos que''.) 

2.24 Repetir el problema 2.23, pero para el caso en que las frecuencias acumuladas sean del tipo "o mayor". 

2.25 Con los datos de la tabla 2.14, estimar el porcentaje de estudiantes que ven la televisión: a) menos de 560 minutos por 
semana, b ) 970 o más minutos por semana y c) entre 620 y 890 minutos por semana. 

2.26 El diámetro interno de las lavadoras producidas por una empresase mide con una exactitud de milésimas de pulgada. Si las 
marcas de clase de la distribución de estos diámetros dados en pulgadas son 0.321, 0.324, 0.327, 0.330, 0.333 y 0.336, 
encontrar: a) la amplitud del Intervalo de clase, b ) las fronteras de clase y c) los límites de clase. 

2.27 En la tabla siguiente se dan los diámetros en centímetros de una muestra de 60 balines fabricados en una empresa. Elaborar 
una distribución de frecuencias de los diámetros empleando los intervalos de clase adecuados. 


1.738 

1.729 

1.743 

1.740 

1.736 

1.741 

1.735 

1.731 

1.726 

1.737 

1.728 

1.737 

1.736 

1.735 

1.724 

1.733 

1.742 

1.736 

1.739 

1.735 

1.745 

1.736 

1.742 

1.740 

1.728 

1.738 

1.725 

1.733 

1.734 

1.732 

1.733 

1.730 

1.732 

1.730 

1.739 

1.734 

1.738 

1.739 

1.727 

1.735 

1.735 

1.732 

1.735 

1.727 

1.734 

1.732 

1.736 

1.741 

1.736 

1.744 

1.732 

1.737 

1.731 

1.746 

1.735 

1.735 

1.729 

1.734 

1.730 

1.740 


2.28 Con los datos del problema 2.27, construir: a) un hlstograma, b) un polígono defrecuencias, c) una distribución defrecuen¬ 
cias relativas, d) un histograma de frecuencias relativas, e) un polígono de frecuencias relativas, f) una distribución de 
frecuencias acumuladas, g ) una distribución acumulada porcentual, h) una ojiva, /) una ojiva porcentual. 

2.29 Empleando los resultados del problema 2.28, determinar el porcentaje de balines cuyo diámetro: a) es mayor que 1.732 cm, 

b ) no es mayor que 1.736 cm y c) está entre 1.730 y 1.738 cm. Comparar los resultados con los obtenidos directamente a 
partir de los datos en bruto del problema 2.27. 

2.30 Repetir el problema 2.28 con los datos del problema 2.20. 

2.31 De acuerdo con la Oficina de los Censos de Estados U nidos, en 1996 la población de este país era de 265 284 000. La tabla 
2.15 da la distribución porcentual en los diversos grupos de edad. 

a) ¿Cuál es la amplitud o el tamaño del segundo intervalo de clase? ¿Y la del cuarto Intervalo de clase? 

b) ¿Cuántos tamaños distintos de intervalos de clase hay? 

c) ¿Cuántos intervalos de clase abiertos hay? 

d) ¿Cómo se deberá escribir el último intervalo de clase de manera que su amplitud sea Igual a la del penúltimo interva¬ 
lo de clase? 

e) ¿Cuál es la marca de clase del segundo intervalo de clase? ¿Y la del cuarto Intervalo de clase? 

f) ¿Cuáles son las fronteras de clase del cuarto intervalo de clase? 

g) ¿Qué porcentaje de la población tiene 35 años o más? ¿Qué porcentaje de la población tiene 64 años o menos? 

h) ¿Qué porcentaje de la población tiene entre 20 y 49 inclusive? 

/) ¿Qué porcentaje de la población tiene más de 70 años? 

2.32 a) ¿Por qué es imposible construir un hlstograma porcentual o un polígono de frecuencias con la distribución de la tabla 

2.15? 

b) ¿Cómo hay que modificar esta distribución para que se pueda construir un histograma porcentual o un polígono de 
frecuencias? 

c) Usando la modificación del inciso ib), construir estas gráficas. 
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Distribuciones de frecuencias 


Tabla 2.15 


Grupo de edad en años 

% de Estados U nidos 

M enosde5 

7.3 

5-9 

7.3 

10-14 

7.2 

15-19 

7.0 

20-24 

6.6 

25-29 

7.2 

30-34 

8.1 

35-39 

8.5 

40-44 

7.8 

45-49 

6.9 

50-54 

5.3 

55-59 

4.3 

60-64 

3.8 

65-74 

7.0 

75-84 

4.3 

85 o más 

1.4 


Fuente: U .S. Bureau of the Census, Current Population Reports. 


2.33 Con relación a la tabla 2.15, supóngase que la población total es 265 millones y que la clase "menos de 5" comprende a 
niños menores de 1 año. Dar el número de individuos que hay en cada grupo, en millones, con una exactitud de una déci¬ 
ma de millón. 

2.34 a) Trazar un polígono de frecuencias porcentuales suavizado y una ojiva porcentual suavizada que correspondan a los 

datos de la tabla 2.14. 

b ) Empleando los resultados del inciso a), estimar la probabilidad de que un estudiante vea menos de 10 horas de televi¬ 
sión por semana. 

c) Empleando los resultados del inciso a), estimar la probabilidad de que un estudiante vea 15 horas o más de televisión 
por semana. 

d) Empleando los resultados del inciso a), estimarla probabilidad de que un estudiante vea menos de 5 horas de televisión 
por semana. 

2.35 a) Lanzar 50 veces cuatro monedas y tabular la cantidad de caras que obtiene en cada lanzamiento. 

b) Elaborar una distribución de frecuencias en la que se muestre la cantidad de lanzamientos en los que se obtuvo 0,1, 
2, 3 y 4 caras. 

c) Elaborar la distribución porcentual correspondiente al inciso ó). 

d) Comparar los porcentajes obtenidos con los teóricos, 6.25%, 25%, 37.5%, 25% y 6.25% (proporcionales a 1, 4, 6, 4, 
y 1), que se obtienen por las reglas de la probabilidad. 

e) Graficar las distribuciones de los incisos b) y c) 

f) Trazar la ojiva porcentual correspondiente a los datos. 

2.36 Repetir el problema 2.35 con 50 lanzamientos más de las cuatro monedas y ver si hay mayor coincidencia con lo que se 
espera teóricamente. Si no es así, dar los razonamientos que puedan explicar esas diferencias. 





M EDI A, MEDIANA, 
MODA, Y OTRAS 
MEDIDAS DE 
TENDENCIA 
CENTRAL 



ÍNDICESO SUBÍNDICES 

El símbolo, X¡ (que se lee "X subíndice 7 ") representa cualquiera de los N valores X v X 2 , X 3 ,..., X N que puede tomar 
Ia variable X. A la letra / que aparece en X¡ representando a cualquiera de los números 1, 2, 3. N se le llama subín¬ 

dice o índice. En lugar de/ se puede usar, por supuesto, cualquier otra letra, /, k, p, q o s. 

SU MATO RIA 

El símbolo J2‘¡Lí x ¡ se emplea para denotar la suma de todas las X; desde/ = 1 hasta / = W; por definición, 

N 

'Y. Xj = + x 2 + x 3 + ■ ■ ■ + X N 

7=1 

Cuando no puede haber confusión, esta suma se denota simplemente como o J2jXj. El símbolo X] es la 

letra griega mayúscula sigma y denota suma. 

N 

EJEMPLO 1 X j Y j = X¡ Y x + X 2 Y 2 + X 3 Y 3 + • • • + X N Y N 
7=1 

N N 

EJEMPLO 2 J2 aX j = aX,+aX 2 + --- + ctX N = a{X x +X 2 + --- + X N ) = «Y X J 
7=1 7=1 

donde a es una constante. O bien simplemente J2 aX = aJ^X. 

EJEMPLO 3 SI a, b y c son cualesquiera constantes, entonces X] ( aX+bY - cZ) = aY, X + b Ver pro¬ 

blema 3.3. 
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PROMEDIOSO MEDIDAS DE TENDENCIA CENTRAL 

Un promedio es un valor típico o representativo de un conjunto de datos. Como estos valores típicos tienden a encon¬ 
trarse en el centro de los conjuntos de datos, ordenados de acuerdo con su magnitud, a los promedios se les conoce 
también como medidas de tendencia central. 

Se pueden definir varios ti pos de promedios; los más usados son la media aritmética, la mediana, la moda, ¡a media 
geométrica y la media armónica. Cada una de ellas tiene ventajas y desventajas de acuerdo con el tipo de datos y el 
propósito de su uso. 


LA MEDIAARITM ÉTICA 


La media aritmética, o brevemente la media, de un conjunto de/V números X x , X 2 , X 3 ,...,X N se denota así: X (que se 
lee "X barra”) y está definida como 


X = 


X¡ + X 2 + X 2 + • • • + Xfl 

Ñ 


N 


E x j 


j =1 

N 


EE 

N 


( 1) 


EJEMPLO 4 La media aritmética de los números 8, 3, 5,12 y 10 es 


- 8 + 3 + 5+ 12+ 10 38 

X =-5-= y = 7 - 6 


Silos númerosX-p X 2 ,...,X K se presentan f 1; f 2 ,..., f K veces, respectivamente (es decir, se presentan con frecuencias 
f 1; f 2 ,...,f K ), su media aritmética es 

K 

E f i x J 

f\X 1 + f 2 x 2 + ■ ■ • + ¡= 1 E fx E fx 


X = 


fx + f 2 + • • • + f K 


K 

E f j 

y=i 


E f 


N 


( 2 ) 


donde N = E / es la suma délas frecuencias (es decir, la cantidad total de casos). 


EJEMPLO 5 Si 5, 8, 6 y 2 se presentan con frecuencias 3, 2, 4 y 1, respectivamente, su media aritmética es 

- _ (3)(5) + (2)(8) + (4) (6) + ( 1) (2) _ 15 + 16 + 24 + 2 _ g , 


3+2+4+1 


10 


MEDIA ARITMÉTICA PONDERADA 


A Igunas veces, a los números X 1; X 2 . X K se les asignan ciertos factores de ponderación (o pesos) i/i/ 1; w 2 ,...,w K , 

que dependen del significado o Importancia que se les asigne a estos números. En este caso, a 

_ W\X\ + W 2 x 2 + ■ ■ ■ + WK X k _ E wX 

w¡ + w 2 H-I -w K E w 

se le llama media aritmética ponderada. Obsérvese la semejanza con la ecuación (2), la cual se puede considerar como 
una media aritmética ponderada con pesosf 1; f 2 ,..., f K . 


EJEMPLO 6 Si en una clase, al examen final se le da el triple de valor que a los exámenes parciales y un estudiante obtiene 85 
en el examen final, y 70 y 90 en los dos exámenes parciales, su puntuación media es 


X = 


(1)(70) + (1) (90) + (3)(85) 



1 + 1 + 3 
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PROPIEDADES DE L A M EDIA ARITM ÉTIC A 

1. En un conjunto de números, la suma algebraica de las desviaciones de estos números respecto a su media aritmé¬ 
tica es cero. 

EJEMPLO 7 Las desviaciones de los números 8, 3, 5, 12 y 10 de su media aritmética, 7.6, son 8 - 7.6, 3 - 7.6, 5 - 7.6, 

12 - 7.6 y 10 -7.6 o bien 0.4, -4.6, -2.6, 4.4 y 2.4, cuya suma algebraica es 0.4 - 4.6 - 2.6 + 4.4 + 2.4 = 0. 

2. En un conjunto de números Xy, la suma délos cuadrados de sus desviaciones respecto a un número a es un mínimo 
si y sólo si a = X (ver el problema 4.27). 

3. Si la media de^ números es m 1 , la media def 2 números es m 2 ,..., la media de f k números es m k , entonces la media 
de todos estos números es 


y _ j\ m \ +Í2 m 2 + ' ' ' +.ÍK m K 

f\ +fi + • • • +/k 

es decir, una media aritmética ponderada de todas las medias (véase el problemas 3.12). 

4. Si se cree o se supone que un número A (que puede ser cualquier número) es la media aritmética y si d¡ = X¡ - A 
son las desviaciones deXydeA, entonces las ecuaciones (1) y (2) se convierten, respectivamente, en 


X = A 


N 

Y d ¡ 

7=1 

N 


= A 


El 

N 


(5) 


donde N = E j= i fj 
problema 3.18). 


X = A 


K 

Y M 

7=1 


Yfj 


= A + 


EJl 

N 


(6) 


Ef ■ Obsérvese que las fórmulas (5) y (6) se resumen en la ecuación X = A + d (ver 


CÁLCULO DE LA MEDIA ARITM ÉTICA PARA DATOS AGRUPADOS 

Cuando se presentan los datos en una distribución de frecuencias, se considera que todos los datos que caen en un 
intervalo de clase dado coinciden con la marca o punto medio del intervalo. Para datos agrupados, interpretando a las 
Xy como las marcas de clase, a las f¡ como las correspondí entes frecuencias de clase, a A como cualquier marca de clase 
supuesta y d¡ = X¡ - A como la desviación deXy respecto de A, las fórmulas (2) y (6) son válidas. 

A los cálculos empleando las fórmulas (2) y (6) se les suele conocer como método largo y método abreviado, res¬ 
pectivamente (ver los problemas 3.15 y 3.20). 

SI todos los Intervalos de el ase son de una misma amplitud c, las desviaciones d¡ = X¡ -A se pueden expresar como 
cuy, donde u¡ puede tener valores enteros positivos o negativos o cero (es decir, 0, ±1, ±2, ±3,...) con lo que la 
fórmula (6) se convierte en 


X = A + 


/ K 
Y fj u J 

7=1 

\ N 


= A + 



(7) 


lo que es equivalente a la ecuación X = A + cü (ver problema 3.21). A esta ecuación se le conoce como método codi¬ 
ficado para calcular la media. Es un método muy breve recomendado para datos agrupados cuando los Intervalos de 
clase tienen todos la misma amplitud (ver problemas 3.22 y 3.23). Obsérvese que en el método codificado los valores 
de la variableX se transforman en valores de la variable u de acuerdo con X = A + cu. 
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LA MEDIANA 

La mediana de un conjunto de números acomodados en orden de magnitud (es decir, en una ordenación) es el valor 
central o la media de los dos valores centrales. 

EJEMPLO 8 La mediana del conjunto de números 3, 4, 5, 6 , 8 , 8 , 8 y 10 es 6 . 

EJEMPLO 9 La mediana del conjunto de números 5, 5, 7, 9,11,12,15 y 18 es 3 (9 + 11) = 10. 

En datos agrupados, la mediana se obtiene por Interpolación, como se expresa por la fórmula 



( 8 ) 


donde L 1 = frontera Inferior de la clase mediana (es decir, de la clase que contiene la mediana) 


N = número de datos (es decir, la frecuencia total) 

(S/)i = Süma de las frecuencias de todas las clases anteriores a la clase mediana 
^mediana = frecuencia de la clase mediana 


mediana 


c = amplitud del Intervalo de la clase mediana 


Geométricamente, la mediana es el valor deX (abscisa) que corresponde a una recta vertical que divide al histo- 
grama en dos partes que tienen la misma área. A este valor deX se le suele denotar X. 


LA MODA 


La moda de un conjunto de números es el valor que se presenta con más frecuencia; es decir, es el valor más frecuen¬ 
te. Puede no haber moda y cuando la hay, puede no ser única. 

EJEMPLO 10 La moda del conjunto 2, 2, 5, 7, 9, 9, 9,10,10,11,12 y 18 es 9. 

EJEMPLO 11 El conjunto 3, 5, 8,10,12,15 y 16 no tiene moda. 

EJEMPLO 12 El conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7 y 9 tiene dos modas, 4 y 7, por lo que se le llama bimodal. 

A una distribución que sólo tiene una moda se le llama unimodal. 

En el caso de datos agrupados, para los que se ha construido una curva de frecuencia que se ajuste a los datos, la 
moda es el valor (o los valores) deX que corresponden al punto (o puntos) máximos de la curva. A este valor deX se 
le suele denotar X. 

En una distribución de frecuencia o en un hlstograma la moda se puede obtener mediante la fórmula siguiente: 



(9) 


donde L 1 = frontera Inferior de la clase modal (es decir, de la clase que contiene la moda) 

= exceso de frecuencia modal sobre la frecuencia en la clase Inferior Inmediata 
A 2 = exceso de frecuencia modal sobre la frecuencia en la clase superior Inmediata 
c = amplitud del Intervalo de la clase modal 

RELACIÓN EMPÍRICA ENTRE LA MEDIA,LAMEDIANAY LA MODA 

En las curvas de frecuencias unimodales que son ligeramente sesgadas (asimétricas), se tiene la relación empírica 
siguiente: 


(10) 


M edia - moda = 3(medla - mediana) 
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En las figuras 3-1 y 3-2 se muestran las posiciones relativas de la media, la mediana y la moda en curvas de fre¬ 
cuencias sesgadas a la derecha o a la izquierda, respectivamente. En las curvas simétricas, la media, la mediana y la 
moda coinciden. 



Figura 3-1 Posiciones relativas de la media, la mediana y la moda en curvas de frecuencias sesgadas a la derecha. 



Figura. 3-2 Posiciones relativas de la media, la mediana y la moda en curvas de frecuencias sesgadas a la izquierda. 


LA MEDIAGEOMÉTRICAG 

La media geométrica G de A/ números positivosX x , X 2 , X 3 .X N es la raíz n-ésima del producto de los números: 

G = tyx l X 2 X 3 ---X N ( 11 ) 


EJEMPLO 13 La media geométrica de los números 2,4 y 8 es G =^/(2)(4)(8) =-^64 = 4. 

G se puede calcular empleando logaritmos (ver problema 3.35) o usando una calculadora. Para la media geométri¬ 
ca de datos agrupados, ver los problemas 3.36 y 3.91. 


LA M EDIA ARM ÓNICA H 


La media armónica H de un conjunto de N números X 1( X 2 , X 3 . X N es el recíproco de la media aritmética de los 

recíprocos de los números: 



(12) 
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En la práctica es más fácil recordar que 


H N N 2 ^ X 


(13) 


EJEMPLO 14 La media armónica de los números 2,4 y 8 es 


Para la media armónica de datos agrupados ver los problemas 3.99 y 3.100. 

RELACIÓN ENTRE LAS MEDIASARITMÉTICA,GEOMÉTRICAY ARMÓNICA 

La media geométrica de un conjunto de números positivos X 1; X 2 ,...,X N es menor o Igual que su media aritmética, 
pero mayor o Igual que su media armónica. En símbolos, 

H < G < X (14) 

La igualdad es válida sólo cuando todos los números X 1; X 2 . X N son Idénticos. 

EJEMPLO 15 La media aritmética de los números 2, 4 y 8 es 4.67, su media geométrica es 4 y su media armónica es 3.43. 


LA RAÍZ CUADRADA MEDIA 

La raíz cuadrada media (RCM ) o media cuadrática de un conjunto de númerosX 1; X 2 ,...,X N suele denotarse \íx~ 2 y 
se define 


RCM == \[x 1 = 




Este tipo de promedio suele usarse en aplicaciones físicas. 


EJEMPLO 16 La raíz cuadrada media del conjunto 1, 3, 4, 5, y 7 es 


l 2 + 3 2 + 4 2 + 5 2 + 7 2 


= %/20 = 4.47 


(15) 


CUARTILES, DECILESY PERCENTI LES 

En un conjunto de datos en el que éstos se hallan ordenados de acuerdo con su magnitud, el valor de en medio (o la 
media aritmética de los dos valores deen medio), quedivide al conjunto en dos partes ¡guales, es la mediana. Continuando 
con esta ¡dea se puede pensar en aquellos valores que dividen al conjunto de datos en cuatro partes ¡guales. Estos 
valores, denotados Q 1( Q 2 y Q 3 son el primero, segundo y tercer cuartiles, respectivamente; el valor 0 2 coincide con 
la mediana. 

De Igual manera, los valores que dividen al conjunto en diez partes ¡guales son los deciles y se denotan D 1: 
D 2 ,..., D 9 , y los valores que dividen al conjunto en 100 partes ¡guales son los percentiles y se les denota P v P 2 ,..., 
P 99 . El quinto decil y el percenti I 50 coinciden con la mediana. Los percenti les 25 y 75 coinciden con el primero y 
tercer cuartiles, respectivamente. 

A los cuartiles, deciles, percentlles y otros valores obtenidos dividiendo al conjunto de datos en partes ¡guales se 
les llama en conjunto cuantiles. Para el cálculo de estos valores cuando se tienen datos agrupados ver los problemas 
3.44 a 3.46. 
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EJEMPLO 17 Utilizar EXCEL para hallar Q v Q 2 , Q 3 , D 9 y P 95 , en la muestra siguiente de puntuaciones. 


88 

45 

53 

86 

33 

86 

85 

30 

89 

53 

41 

96 

56 

38 

62 

71 

51 

86 

68 

29 

28 

47 

33 

37 

25 

36 

33 

94 

73 

46 

42 

34 

79 

72 

88 

99 

82 

62 

57 

42 

28 

55 

67 

62 

60 

96 

61 

57 

75 

93 

34 

75 

53 

32 

28 

73 

51 

69 

91 

35 


Para encontrar el primer cuartll, ingrese los datos en los primeros 60 renglones de la columna A de la hoja de 
cálculo de EXCEL. Después, dé el comando =PERCENTILE(A 1: A 60,0.25). EXCEL da el valor 37.75. Se encuentra 
que 15 de los 60 valores, o el 25%, son menores que 37.75. De Igual manera =PERCENTILE(A1:A60,0.5) da 57, 
=PERCENTILE(A 1 :A60,0.75) da 76, =PERCENTILE(A 1:A60,0.9) da89.2, =PERCENTILE(A 1:A60,0.95) da94.1. 
EXCEL da los cuarti les, decilesy percentl les expresados como percenti I es. 

A continuación se describe un algoritmo que suele emplearse para hallar cuarti les, deciles y percenti les. Primero 
se ordenan los datos del ejemplo 17 de acuerdo con su magnitud; el resultado es: 


Puntuaciones de examen 


25 

28 

28 

28 

29 

30 

32 

33 

33 

33 

34 

34 

35 

36 

37 

38 

41 

42 

42 

45 

46 

47 

51 

51 

53 

53 

53 

55 

56 

57 

57 

60 

61 

62 

62 

62 

67 

68 

69 

71 

72 

73 

73 

75 

75 

79 

82 

85 

86 

86 

86 

88 

88 

89 

91 

93 

94 

96 

96 

99 


Supóngase que se quiere encontrar el primer cuartil (que es el percentll 25). Se calcula /= np/100 = 60(25)/100 
= 15. Como 15 es un número entero, se saca el promedio de los datos en las posiciones 15 y 16 de los datos ordenados 
de menor a mayor. Es decir, se promedian 37 y 38 y se obtiene 37.5 como primer cuartll (Q 1 = 37.5). Para hallar el 
percentll 93, se calcula np/100 = 60(93)/100 y se obtiene 55.8. Como este número no es un entero, se redondea hacia 
arriba y se obtiene 56. El número que ocupa la posición 56 en los datos ordenados es 93 y P 93 = 93. El comando de 
EXCEL=PERCENTILE(A 1: A 60,0.93) da 92.74. Obsérvese que con EXCEL no se obtienen los mismos valores para 
los percenti les, pero sí valores cercanos. A medida que los conjuntos de datos son mayores, tienden a obtenerse los 
mismos valores. 

SOFTWARE Y MEDIDAS DE TENDENCIA CENTRAL 

Todos los paquetes de software utilizados en este libro dan las estadísticas descriptivas vistas en esta sección. A con¬ 
tinuación se presentan los resultados que se obtienen con estos cinco paquetes empleando las puntuaciones de examen 
del ejemplo 17. 

EXCEL 

Seleccionando la secuencia "Tools => Data Analysis => Descriptive Statistics", se obtienen las medidas de tendencia 
central mediana, media y moda, así como varias medidas de dispersión. 


Media 

59.16667 

Error típico 

2.867425 

Mediana 

57 

Moda 

28 

Desviación estándar 

22.21098 

Varianza de la muestra 

493.3277 

Curtosis 

-1.24413 

Coeficiente de asimetría 

0.167175 

Rango 

74 

Mínimo 

25 

Máximo 

99 

Suma 

3 550 

Cuenta 

60 
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MINITAB 

Si se selecciona la secuencia "Stat=> Basic Statistics => Display Descriptive Statistics", como resultado se obtiene: 
Estadística descriptiva: calificación de examen 

Variable N N* Media SE media Desv est Mínimo Q1 Mediana Q3 Máxima 

Punt examen 6 0 0 5 9,1 7 2.8 7 2 2.2 1 2 5.0 0 3 7.2 5 5 7.0 0 7 8.0 0 9 9,0 0 

SPSS 

Si se selecciona la secuencia “Analyze=> Descriptive Statistics => Descriptives”, como resultado se obtiene: 


E stadística descriptiva 



N 

M ínimo 

M áximo 

M edia 

Desviación 

estándar 

Puntuación de examen 

60 

25.00 

99.00 

59.1667 

22.21098 

N válida 

60 






SAS 

Si se selecciona la secuencia "Solutions => Análisis => Analyst” y los datos se leen como un archivo, seleccionando 
la secuencia "Statistics => Descriptive => Summary Statistics", se obtiene como resultado: 


The MEANS Procedure 
Analysis Variable : Testscr 

Mean Std Dev N Minimum Máximum 

ffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff 
59.1666667 22.2109811 60 25.0000000 99.0000000 

ffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff 


STATI STIX 

Si se selecciona la secuencia "Statistics => Summary Statistics => Descriptive Statistics” del paquete STATISTIX, 
como resultado se obtiene: 


Statistix 8.0 
Descriptive Staistics 


N 

Testscore 

60 

Mean 

59.167 

SD 

22.211 

Minimum 

25.000 

lst Quarti 

37.250 

3rd Quarti 

78.000 

Máximum 

99.000 
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PROBLEMAS RESUELTOS 


SU MATO RIA 


3.1 Escribir los términos de cada una de las sumas siguientes: 


N 


7=1 


a) J2 x j c) Y a e ) Y^ x J~ a ) 

7=1 7=1 

b) ~ 3) 2 d) J2f k X k 


7=1 


SOLUCION 


k= 1 


a) z, 

b) {Y\ — 3) 2 + (Y 2 - 3) 2 + (Y 3 - 3) 2 + (Y 4 - 3) 2 

C) ci -\- ci ü ci = Na 

d) f\X\ +f 2 X 2 +f¡X 3 +/4X4 +/5X5 

e) — a) + ( 3^2 — ¿z) + (X 3 — 7 /) = + X 2 -i- X 3 — 3 a 


3.2 Expresar cada una de las sumas siguientes empleado el símbolo de sumatoria. 


a) x¡ + x 2 + x 3 + • • • + X\q 

b) (X\ + Y]) + ( X 2 + Y 2 ) + • • • + (X% + Y$) 

c ) f\ x l +f 2 x 2 + • • • +/ 20 E 0 

d) ci\b\ + ü 2 b 2 a 3 b 3 3 - • • • 3 - ci^b^¡ 

e ) f\ x \ Y \ X f 2 X 2 Y 2 +f 3 X 3 Y 3 +/4Z4 Y 4 


SOLUCIÓN 

10 

a) ¿X? 

7=1 

b) 'E(Xj+ y j) 

7=1 


0 E ftf 

7=1 


d) E fl A 

7=1 


4 


e) E /,-V, y, 

7=1 


3.3 Probar que Ylj=\( aX j + bY j ~ cZ j) = a Y!¡=\ x j + b YIjLi Y j ~ c E=i z y> donde a, b y c son constantes. 

SOLUCIÓN 

N 

^ ^ (flAy -\- bYj — cZj) = (¿/Aj -\- bY\ — cZ \) 4 - (#A2 + ¿E2 — + • • • 4 - {ciX^ + Z? E/y — cZjy) 

7=1 

= (¿lEi + ¿2X2 -{-•••-{- flXjy) + (bY\ H- bY2 H- • • • 4 - bYpj) — ( cZ\ + cZ 2 + • • • + cZ^¡) 

= a(X\ + X2 + • • • + X^) + b( Y\ 4 - Y2 4- • • • 4- E/y) — c{Z\ 4 - Z2 + • • ■ 4- Z n) 

N N N 

= a Y x J+ b Y y j- <: Y z j 

7=1 7=1 7=1 

o brevemente, I] (aX + bY - cZ) = aj^x + bJ2 Y - cJ2 z - 
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3.4 Dos variables, X y y toman los valores X 1 = 2, X 2 = -5, X 3 = 4, X 4 = -8 y y 3 = -3, Y 2 = -8, Y 3 = 10, 
y 4 = 6 , respectivamente. Calcular a) £X, b) £/, c) £Xy, d) 2 , e) J]y 2 , f) (EX)(E y )' g) J^XY 2 y 

/i)E(x + y )(x - r). 

SOLUCIÓN 

Obsérvese que en todos los casos se ha omitido enX y y el subíndice y y que la E se entiende como Por lo tanto, por 
ejemplo EX es abreviación deE;=i x j- 

a) E X = (2) + (-5) + (4) + (- 8 ) = 2 — 5 + 4 — 8 = —7 
ó) E X = (-3) + (- 8 ) + ( 10 ) + ( 6 ) = -3 - 8 + 10 + 6 = 5 
C) E XY = (2)(—3) + (—5)(— 8 ) + (4)(10) + (— 8 )( 6 ) = -6 + 40 + 40 - 48 = 26 
Cf) E ^ 2 = (2 ) 2 + (—5 ) 2 + (4 ) 2 + (— 8) 2 = 4 + 25 + 16 + 64 = 109 

e) E Y 2 = (—3 ) 2 + (— 8) 2 + (10 ) 2 + ( 6) 2 = 9 + 64 + 100 + 36 = 209 

f) (EEKE Y ) = (-7)(5) = -35, de acuerdo con los incisos a) y b ). Obsérvese que(EEKE Y ) ^ J2 XY . 

g) E^X 2 = (2)(—3 ) 2 + (—5)(— 8) 2 + (4)(10 ) 2 + (- 8 )( 6) 2 = -190 

h) E (-X+ Y )( x - Y) = E (X ' 2 - X 2 ) = E-X 2 - E X 2 = 109 - 209 = - 100 , de acuerdo con los incisos d) y e). 


3.5 En una nota deL/S/4 Today se Informa que el promedio de impuestos, per cápita, recolectados en 2005, en todo 
Estados Unidos, fue de $2 189.84. Esta cantidad se desglosa así: ventase ingresos, $1051.42; Ingreso, $875.23; 
licencias, $144.33; otros, $80.49, y propiedades, $38.36. Usando EXCEL, demostrar que la suma es Igual a $2 
189.84. 

SOLUCIÓN 

5 

Obsérvese que la expresión =sum(A 1:A5) es equivalente a ^ x r 

y=i 


1 051.42 

ventas e ingresos 

875.23 

ingreso 

144.33 

licencias 

80.49 

otros 

38.36 

propiedades 

2 189.83 

=sum(A1 :A5) 


LA MEDIAARITM ÉTICA 

3.6 Las calificaciones de un estudiante en seis exámenes fueron 84, 91, 72, 68 , 87 y 78. Hallarla media aritmética 
de estas calificaciones. 

SOLUCIÓN 


- EX 84 + 91 + 72 + 68 + 87 + 78 480 

X = ^r = - 6 -“ = 80 

El término promedio suele emplearse como sinónimo de media aritmética. Sin embargo, estrictamente hablando, esto no 
es correcto, ya que además de la media hay otros promedios. 

3.7 Un científico mide diez veces el diámetro de un cilindro y obtiene los valores 3.88, 4.09, 3.92, 3.97, 4.02, 3.95, 
4.03, 3.92, 3.98 y 4.06 centrímetros (cm). Hallar la media aritmética de estas mediciones. 
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SOLUCIÓN 

- EX 3.88 + 4.09 + 3.92 + 3.97 + 4.02 + 3.95 + 4.03 + 3.92 + 3.98 + 4.06 39.82 _ 

X = ^T= -Tó-= _=3.98cm 

3.8 En el siguiente resultado obtenido con M INITAB se muestra la cantidad de tiempo por semana que 30 personas 
estuvieron empleando en Internet, así como la media de estas cantidades. ¿Podría decirse que este promedio es 
típico de las 30 cantidades? 

MTB > pri nt el 
Muestra de datos 

t i e mp o 

3 4 4 5 5 5 5 5 5 6 

6 6 6 7 7 7 7 7 8 8 

9 1 0 1 0 1 0 1 0 1 0 1 0 1 2 5 5 6 0 

MTB > mean el 

Media de la columna 

Mean of ti me = 10.400 

SOLUCIÓN 

Esta media de 10.4 horas no es típica de estas cantidades. Obsérvese que 21 de estas cantidades son de un solo dígito y que 
la media es 10.4 horas. U na gran desventaja de la media es que es fuertemente afectada por valores atípicos (o valores 
extremos.) 

3.9 Encontrar la media aritmética de los números 5, 3, 6 , 5, 4, 5, 2, 8 , 6 , 5, 4, 8 , 3, 4, 5, 4, 8 , 2, 5 y 4. 

SOLUCIÓN 
Primer método 

27 5 + 3 + Ó + 5 + 4+ 5 + 2 + 8 + 6 + 5 + 4 + 8 + 3 + 4 + 5 + 4+ 8 + 2 + 5 + 4 96 

X= N~ -20- “a" 48 

Segundo método 

Hay las siguientes cantidades: seis 5, 

,_E/y_E./y 

3.10 De 100 números, 20 fueron 4, 40 fueron 5, 30 fueron 6 y los restantes fueron 7. Encuéntrese la media aritmé¬ 
tica de estos números. 

SOLUCIÓN 

y E./y EA (20) (4) + (40) (5) + (30) (6) + (10)(7) 530 

N 100 100 

3.11 Las calificaciones finales de un estudiante en matemáticas, física, Inglés e higiene son, respectivamente, 82, 
86,90 y 70. SI los créditos en cada uno de estos cursos son 3, 5, 3 y 1, determinar la correspondí ente calificación 
promedio. 


dos 3, dos 6 , cinco 4, dos 2 y tres 8 . Por lo tanto 

_ (6)(5) + (2)(3) + (2)(6) + (5) (4) + (2)(2) + (3)(8) _ 96 
6 + 2 + 2 + 5 + 2 + 3 20 
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SOLUCIÓN 

Se emplea la media aritmética ponderada, en donde los pesos que corresponden a cada puntuación son los créditos que les 
corresponden. Así, 


_ E _ (3)(82) + (5)(86) + (3)(90) + (1)(70) 
Y. w 3 + 5 + 3 + 1 


3.12 En una empresa en la que hay 80 empleados, 60 ganan $10.00 por hora y 20 ganan $13.00 por hora. 

a) Determinare! sueldo medio por hora. 

b) En el Inciso a), ¿se obtiene la misma respuesta si los 60 empleados tienen un salarlo promedio de $10.00 
por hora? Probar la respuesta. 

c) ¿Se considera que este salarlo medio por hora es representativo? 

SOLUCIÓN 


a) 


- _ J2f x _ (60)(B10.00) + (20)($13.00) 
N 60 + 20 


b ) Sí, el resultado es el mismo. Para probar esto supóngase que la media de números es m 1 y que la media de f 2 núme¬ 
ros es m 2 . H ay que demostrar que la media de todos estos números es 

^ _/i"*i +f 2 m 2 

/,+/ 2 

Sea Mj la suma de los f x números y M 2 la suma de los f 2 números. Entonces, por definición de media aritmética, 


M x 

7T 



o M ! = f 1 m 1 y M 2 = f 2 m 2 . Como todos los (fj + f 2 ) números suman (M l + M 2 ), la media aritmética de todos estos 
números es 


- _ + Mi _ j\m\ +J 2 m 2 

f\ +Í 2 f\ +f 2 

como se deseaba. Este resultado se puede ampliar fácilmente, 

c) Se puede decir que $10.75 es un salarlo "representativo" por hora en el sentido de que la mayor parte de los empleados 
gana $10.00 por hora, lo que no se aleja mucho de $10.75 por hora. Se debe recordar que siempre que se resuman 
datos numéricos en un solo dato (como en un promedio) es posible que se cometa algún error. Sin embargo, el resul¬ 
tado desorienta tanto como en el problema 3.8 

En realidad, para tener una mejor ¡dea se debe dar una estimación de la "dispersión" o "variación" de los datos 
con respecto a la media. A esto se le llama dispersión de los datos. En el capítulo 4 se dan varias medidas de disper¬ 
sión. 


3.13 Los pesos medio de cuatro grupos de estudiantes que constan de 15, 20,10 y 18 Individuos son 162,148,153 
y 140 libras, respectivamente. Encuentre el peso medio de todos los estudiantes. 

SOLUCIÓN 

f Zf x (15) (162) + (20) (148) + (10) (153) + (18) (140) 

X 15 + 20+ 10+ 18 150 b 

3.14 El Ingreso medio anual de trabajadores agrícolas y no agrícolas es $25 000 y $35 000, respectivamente; ¿el 
Ingreso medio anual de los dos grupos será $30 000? 
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SOLUCIÓN 

Sería $30 000 únicamente si la cantidad de trabajadores agrícolas y no agrícolas fuese la misma. Para determinar el verda¬ 
dero ingreso medio anual se necesita saber cuál es la cantidad relativa de trabajadores en cada grupo. Supóngase que 10% 
de los trabajadores son trabajadores agrícolas. En ese caso la media será (0.10)(25 000) + (0.901(35 000) = $34 000. Si la 
cantidad de trabajadores de ambos tipos es la misma, la media será (0.50)(25 000) + (0.50)(35 000) = $30 000. 


3.15 Usando la distribución de frecuencias de las estaturas que se presenta en la tabla 2.1, hallar la estatura media 
de los 100 estudiantes de la universidad X Y Z. 


SOLUCIÓN 

En la tabla 3.1 se presentan los datos organizados para hacer los cálculos. Obsérvese que como estatura de los estudiantes 
que miden de 60 a 62 pulgadas (in), de 63 a 65 in, etc., se toman 61 in, 64 in, etc., respectivamente. Entonces, el problema 
se reduce a encontrar la estatura media de 100 estudiantes si 5 tienen una estatura de 61 in, 18 tienen una estatura de 64 in, 
etcétera. 

Estos cálculos pueden resultar tediosos, en especial en los casos en que los números son grandes y se tienen muchas 
clases. Existen técnicas abreviadas para reducir el trabajo; ver los problemas 3.20 y 3.22. 


Tabla 3.1 


Estatura (in) 

M arcas de clase (X) 

Frecuencias (f) 

fX 

60-62 

61 

5 

305 

63-65 

64 

18 

1 152 

66-68 

67 

42 

2 814 

69-71 

70 

27 

1890 

72-74 

73 

8 

584 


O 

O 

i—1 

II 

M— 

w 

II 

S 

E fX = 6 745 


_ E f* 
YJ 


Yjx 

N 


6 745 
100 


= 67.45 in 


PROPIEDADES DE LA M EDIA ARITM ÉTICA 

3.16 Probar que la suma de las desviaciones deX 1; X 2 ,...,X w respecto a su media X es igual acero. 

SOLUCIÓN 


Sean = X x - X, d 2 = X 2 - X,...,d N = X N - X las desviaciones deXj, X 2 ,...,X N de su media, X. Entonces 


La suma de las desviaciones = Zj 4 = E ( x j - X) = X¡ - NX 

= E Xj=T, Xj-T, Xj = o 

donde se usa en vez deZjE- Si se desea, también se puede omitir el subíndice/ deXy siempre que éste se sobreentienda. 
3.17 Si Z, = X¡ + Y u Z 2 = X 2 + Y 2 ,...,Z n = X n + Y n , probar que Z = X + Y. 

SOLUCIÓN 

Por definición 


X = 


E x 


Y = 


E x 


z = 


Ez 


N 


N 


N 
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Por lo tanto z . _ T£+EI = + f + f 


N 


N 


N 


N 


N 


en donde los subíndices deX, Y y Z se han omitido y donde E significa E> i- 


3.18 a) Si las desviaciones de N números X x , X 2 ,...,X N de un número cualquiera/! están dadas por d 1 = X 1 - A , 
d 2 = X 2 - A,..., d N =X N - A, respectivamente, probar que 


N 


Y d i 


X = A 


j= i 


N 


= A 


E d 

N 


b ) En caso de queX 1; X 2 . X K tengas frecuencias respectivas f 1; f 2 ,. 

d K = X K - A demostrar que en lugar del resultado del inciso a) se tiene 


f K y que d 1 = X 1 - A ,. 


X = A 


K 

Y fA 

7=1 

K 

Yfj 

7=1 


= ^ 


E/<* 

AT 


donde Y^f j = Y J f = N 

7=1 


SOLUCIÓN 


a) Primer método 

Y a que d¡ =X¡-A y que X ; = /! + d¡, se tiene 

_ E Xj _ E(^ + dj) _ E A + E 4 _ al 4 + E4 _ j E 4 

- N - N - N Ai TV 

donde se usa en lugar de E/=i para abreviar. 

Segundo método 

Se tiene d = X - A o bien X =A + d, omitiendo los subíndices de d y X. Por lo tanto, de acuerdo con el problema 
3.17, 

X = A + d = A + ^Al 
N 

ya que la media de cualquier cantidad de constantes todas iguales a/! es/!. 


b ) 


x = 


Y fA 

7=i _ E fjXj _ E fj( A + d¡) _ E A f¡ + E fj _ a E fj + E fjdj 

K ~ N ~ N ~ N ~ N 

Yfj 

7=1 

-I.v I Y..ÍA t . Y.fjdj A ! Ydfd 


N 


N 


N 


Obsérvese que formalmente este resultado se obtiene del inciso a) sustituyendo d¡ por fjdj y sumando desdej = 1 hasta 
K en lugar de desde/ = 1 hasta N. El resultado es equivalente a X = A + d, donde d = (E fd)/N. 


CÁLCULO DE LA ME DI A ARITMÉTICA A PARTIR DE DATOS AGRUPADOS 

3.19 Emplee el método del problema 3.18a) para hallar la media aritmética de los números 5, 8, 11, 9, 12, 6, 14 y 
10, eligiendo como "media supuesta" A los valores a) 9 y b) 20. 
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SOLUCIÓN 


a) Las desviaciones de los números dados respecto al 9 son -4, -1, 2, 0, 3, -3, 5 y 1, y la suma de las desviaciones es 

= —4 — 1 + 2 + 0 + 3 — 3 + 5 + l = 3. Por lo tanto 

X = A+^f = 9 + 1 = 9.375 
N 8 

b ) Las desviaciones de los números dados, respecto al 20, son -15, -12, -9, -11, -8, -14, -6 y -10 yJ2 d = -85. 
Por lo tanto, 

X = A + = 20 += 9.375 

N 8 

3.20 Emplee el método del problema 3.18b) para hallar la media aritmética de las estaturas de 100 estudiantes de la 
universidad X Y Z (ver problema 3.15). 


SOLUCION 


Para facilitar los cálculos pueden organizarse los datos como en la tabla 3.2. Como media supuesta A se toma la marca de 
clase 67 (que corresponde a la clase con mayor frecuencia), aunque para A se puede tomar cualquier marca de clase. 
Obsérvese que de esta manera los cálculos son más sencillos que en el problema 3.15. Para simplificar aún más el trabajo, 
se puede proceder como en el problema 3.22, donde se hace uso de que todas las desviaciones (columna 2 de la tabla 3.2) 
son múltiplos enteros de la amplitud del intervalo de clase. 


Tabla 3.2 


M arcas de clase (X) 

Desviación 
d =X -A 

Frecuencias (f) 

fd 

61 

-6 

5 

-30 

64 

-3 

18 

-54 

/4-> 67 

0 

42 

0 

70 

3 

27 

81 

73 

6 

8 

48 


O 

O 

i—1 

II 

M— 

w 

II 

S 

E fd = 45 


X = A + 


N 


61 + m- 61A5m 


3.21 Con d¡ = Xj — A se denotan las desviaciones de las marcas de clase X¡, de una distribución de frecuencias, 
respecto a una marca de clase dada A. M ostrar que si todos los intervalos de clase son de una misma amplitud 
c, entonces: a) todas las desviaciones son múltiplos dec (es decir, d¡ = cu¡ donde u¡ = 0 , ± 1 , ± 2 ,...) y b) que 
la media aritmética se puede calcular empleando la fórmula 


SOLUCIÓN 


X = A + 



c 


a) Lo pedido queda ilustrado en la tabla 3.2 del problema 3.20, donde en la columna 2 se observa que todas las desvia¬ 
ciones son múltiplos de la amplitud del intervalo de clase c = 3 in. 

Para ver que esto es válido en general, obsérvese que si X 1 ,X 2 ,X 3 ,... son marcas de clase sucesivas, la diferen¬ 
cia entre ellas será igual a c, de manera queX 2 =X x + c, X 3 = X Y + 2c, y en general, X¡ —X i + (/ - l)c. Entonces, 
la diferencia entre cualesquiera dos marcas de clase, por ejemplo, X p y X q , será 


Xp-X q = [X¡ + {p- l)c] - [Xi + (q - l)c] = (p- q)c 


que es un múltiplo dec. 
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b ) De acuerdo con el Inciso a), las desviaciones de todas las marcas de clase respecto a una marca de clase dada son 
múltiplos dec (es decir, d¡ = cu¡). Entonces, usando el problema 3.18b), se tiene 


X = A + 


T,fjdj = A + Efj(cUj) 


N 


N 


= A + c Xjh = A + 



c 


Obsérvese que esto es equivalente a X = A + cu, lo que se obtiene de X = A + d sustituyendo d = cu y obser¬ 
vando que d = cu (ver problema 3.18). 


3.22 Emplee los resultados del problema 3.21b) para hallar la estatura media de los 100 estudiantes de la universidad 
X Y Z (ver problema 3.20). 

SOLUCIÓN 

Para facilitar los cálculos pueden organizarse los datos como en la tabla 3.3. A este método de le llama método de compi¬ 
lación y se recomienda usarlo siempre que sea posible. 


Tabla 3.3 


X 

u 

f 

fu 

61 

-2 

5 

-10 

64 

-2 

18 

-18 

67 

-> 

0 

42 

0 

70 

1 

27 

27 

73 

2 

8 

16 



N = 100 

E fu = 15 


X = A + 



c = 67 + 



67.45 in 


3.23 Calcule el salarlo medio semanal de los 65 empleados de la empresa P&R a partir déla distribución de frecuen¬ 
cias de la tabla 2.5, empleando: a) el método largo y b) el método codificado. 

SOLUCIÓN 

En las tablas 3.4 y 3.5 sedan las soluciones dea) y b), respectivamente. 


Tabla 3.4 


Tabla 3.5 


X 

f 

fX 

$255.00 

8 

$2 040.00 

265.00 

10 

2 650.00 

275.00 

16 

4 400.00 

285.00 

14 

3 990.00 

295.00 

10 

2 950.00 

305.00 

5 

1 525.00 

315.00 

2 

630.00 


N =65 

E fX = $18 185.00 


X 

u 

f 

fX 

$255.00 

-2 

8 

-16 

265.00 

-1 

10 

-10 

-> 275.00 

0 

16 

0 

285.00 

1 

14 

14 

295.00 

2 

10 

20 

305.00 

3 

5 

15 

315.00 

4 

2 

8 


N =65 

E fu = 31 
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Puede suponerse que estas tablas i ntroducen un error, ya que en realidad las marcas de clase son $254.995, $264.995, 
etc., y no $255.00, $265.00, etc. Sin embargo, con las marcas de clase de la tabla 3.4, X resulta ser $279.76 en lugar de 
$279.77, lo que es una diferencia despreciable. 

X = = $18 * 85,00 = $279.77 X = A + c = $275.00 + ^ ($10.00) = $279.77 

N 65 y N ) 65 

3.24 Empleando la tabla 2.9 d), hallar el salarlo medio de los 70 empleados de la empresa P&R. 

SOLUCIÓN 

En este caso, los Intervalos de clase no son todos de la misma amplitud, por lo que se tiene que usar el método largo, como 
se muestra en la tabla 3.6 


Tabla 3.6 


X 

u 

fX 

$255.00 

8 

$2 040.00 

265.00 

10 

2 650.00 

275.00 

16 

4 400.00 

285.00 

15 

4 275.00 

295.00 

10 

2 950.00 

310.00 

8 

2 480.00 

350.00 

3 

1 050.00 


N = 70 

E fX = $19 845.00 


- _J2 fx _ $19 845.00 
A ~^T~ 70 


$283.50 


LA MEDIANA 

3.25 En los resultados de M INITAB, a continuación, se presenta el tiempo, por semana, que 30 usuarios de Internet 
pasaron haciendo búsquedas, así como la mediana de estos 30 tiempos. Verificar la mediana. ¿Se considera que 
este promedio es típico (representativo) de estos 30 tiempos? Compárense los resultados con los hallados en el 
problema 3.8. 


MTB > pri nt el 

Muestra de datos 

ti empo 

3 4 4 5 5 5 5 5 

6 6 6 7 7 7 7 7 

9 10 10 10 10 10 10 12 

MTB > medí a n el 

Mediana de columna 

Median of ti me = 7.0000 


5 6 

8 8 
5 5 6 0 


SOLUCIÓN 

Obsérvese que los dos valores de en medio son 7 y que la media de estos dos valores de en medio es 7. En el problema 3.8 
se encontró que la media es 10.4 horas. La mediana es más típica (representativa) de estos tiempos que la media. 
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3.26 En los cajeros automáticos de cinco lugares de una ciudad grande, se registró la cantidad de transacciones por 
día. Los datos fueron 35, 49, 225, 50, 30, 65, 40, 55, 52, 76, 48, 325, 47, 32 y 60. Encontrar: a) la cantidad 
mediana de transacciones y b) la cantidad media de transacciones. 

SOLUCIÓN 

a) Los datos ordenados de menor a mayor son 30, 32, 35, 40, 47, 48, 49, 50, 52, 55, 60, 65, 76, 225 y 325. Como la 
cantidad de datos es un número non, sólo hay un valor de enmedio, 50, que es la mediana buscada. 

b) La suma de los 15 valores es 1189. La media es 1 189/15 = 79.257. 

Obsérvese que a la mediana no le afectan los dos valores extremos 225 y 325, en tanto que a la media sí. 
En este caso, la mediana es un mejor indicador de la cantidad promedio de transacciones diarias en los cajeros auto¬ 
máticos. 


3.27 Si en una ordenación se tienen: a) 85 y b) 150 números, ¿cómo se encuentra la mediana de estos números? 

SOLUCIÓN 

a) Como 85 es un número non, sólo hay un valor de en medio, habiendo 42 números mayores que él y 42 números 
menores que él. Por lo tanto, la mediana es el número que ocupa la posición 43 de la ordenación. 

b ) Como 150 es un número par, hay dos valores de en medio con 74 números menores que ellos y 74 números mayores 
que ellos. Los dos números de en medio son los números en las posiciones 75 y 76 de la ordenación; su media aritmé¬ 
tica es la mediana buscada. 


3.28 A partir de los datos del problema 2.8, encontrar el peso mediano délos 40 estudiantes de la universidad esta¬ 
tal empleando: a) la distribución de frecuencias dada en la tabla 2.7 (reproducida aquí como tabla 3.7) y b) los 
datos originales. 

SOLUCIÓN 

a) Primer método (empleando la interpolación) 

Se supone que los pesos de la tabla 3.7 están distribuidos de manera continua. En ese caso, la mediana es un peso 
tal que la mitad del total de las frecuencias (40/2 = 20) quede por encima de él y la mitad del total de las frecuencias 
quede por debajo de él. 


Tabla 3.7 


Peso (Ib) 

Frecuencias 

118-126 

3 

127-135 

5 

136-144 

9 

145-153 

12 

154-162 

5 

163-171 

4 

172-180 

2 


Total 40 


La suma de lastres primeras frecuencias de clase es 3 + 5 + 9 = 17. Por lo tanto, para dar la frecuencia 20, que es la busca¬ 
da, se necesitan tres más de los 12 casos que pertenecen a la cuarta clase. Como el cuarto Intervalo de clase, 145-153, 
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en realidad corresponde a los pesos desde 144.5 hasta 153.5, la mediana debe encontrarse a 3/12 entre 144.5 y 153.5, es 
decir, la mediana es 


144.5 + ^(153.5 - 144.5) = 144.5 + ^(9) = 146.8 1b 
Segundo método (empleando la fórmula) 

Como las sumas de las primeras tres clases y de las primeras cuatro clases son, respectivamente, 3 + 5 + 9 = 17 y 
3 + 5 + 9 + 12 = 29, la mediana se encuentra en la cuarta clase, que es, por lo tanto, la clase mediana. Entonces. 

L 1 = frontera Inferior de clase de la clase mediana = 144.5 
N = número de datos = 40 

(5D /)i = suma de las frecuencias de todas las clases anteriores a la clase mediana = 3 + 5 + 9 = 17 
^mediana = frecuencia de la clase mediana = 12 

c = amplitud del Intervalo de la clase mediana = 9 


y por lo tanto 


Mediana =L l 


N/ 2-(£ f), 


C = 144.5 


40/2 - 17 
12 


(9) = 146.8 Ib 


b) Dispuestos en una ordenación, los pesos originales son 

119,125,126,128,132,135,135,135,136,138,138,140,140,142,142,144,144,145,145,146 
146, 147,147,148,149,150,150,152,153,154,156,157,158,161,163,164,165,168,173,176 
La mediana es la media aritmética de los pesos en las posiciones 20 y 21 de esta ordenación y es igual a 146 Ib. 


3.29 En la figura 3-3 se muestra una representación detallo y hoja que proporciona el número de muertes en acci¬ 
dentes de tránsito en 2005 relacionados con el alcohol en los 50 estados y Washington, D.C. 


Representación de tallo y hoja: Muertes 

Representación de tallo y hoja: Muertes N =51 
Leaf Unit = 10 

14 0 22334556667889 

23 1 122255778 

( 7 ) 2 0334689 

21 3 124679 

15 4 22669 

10 5 012448 

4 6 3 

3 7 

3 8 

3 9 

3 10 

3 11 

3 12 

3 13 

3 14 7 

2 15 6 

1 16 

1 17 1 

Figura 3-3 M INITAB, representación detallo y hoja de las muertes en accidentes 
de tránsito relacionados con el alcohol. 


Encontrar la media, la mediana y la moda de las muertes relacionadas con el alcohol dadas en la figura 3-3. 
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SOLUCIÓN 

La cantidad de muertes va de 20 a 1 710. La distribución es bimodal. Las dos modas son 60 y 120. Ambas se presentan tres 
veces. 

Laclase) 7 ) 2 0 3 3 4 6 8 9 es la clase med I a na. Es decir, la mediana se encuentra en esta clase. La mediana es 
el dato de en medio o el dato que ocupa la posición 26 en la ordenación. El dato en la posición 24 es 200, el dato en la 
posición 25 es 230 y el dato en la posición 26 es 230. Por lo tanto, la mediana es 230. 

La suma de estos 51 datos es 16 660 y la media es 16 660/51 = 326.67. 


3.30 Encontrar el salarlo mediano de los 65 empleados de la empresa P&R (ver el problema 2.3). 

SOLUCIÓN 

En este caso, N = 65 y N/2 = 32.5. Como la suma de las primeras dos y de las primeras tres frecuencias de clase son 8 + 
10 = 18 y 8 + 10 + 16 = 34, respectivamente, la clase mediana es la tercera clase. U sando la fórmula, 

Mediana = L X + ( N ^~ ~ ^ = $269.995 + f 32 ' 5 ~ 18 V$10.00) = $279.06 

V 'mediana J \ « / 


LA MODA 

3.31 Encontrar la media, la mediana y la moda de los conjuntos: a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 y b ) 51.6, 48.7, 50.3, 
49.5, 48.9. 

SOLUCIÓN 

a) En una ordenación, los números son 2, 2, 3, 5, 5, 5, 6, 6, 8 y 9. 

M edla = -¡^(2 + 2 + 3 + 5 + 5 + 5 + 6 + 6 + 8 + 9) = 5.1 
M ediana = media aritmética de los dos valores de en medio = |(5 + 5) = 5 
M oda = número que se presenta con mayor frecuencia = 5 

b ) En una ordenación, los números son 48.7,48.9, 49.5 50.3 y 51.6. 

M edia = ^ (48.7 + 48.9 + 49.5 + 50.3 + 51.6) = 49.8 
M ediana = número de en medio = 49.5 

M oda = número que se presenta con mayor frecuencia (no existe uno aquí) 

3.32 Supóngase que se desea hallar la moda délos datos de la figura 3-29. Se puede usar el procedimiento "frequen- 
cies" de SAS para obtener el resultado siguiente. Observando el resultado dado por el procedimiento FREQ 
(figura 3-4), ¿cuáles son las modas de la cantidad de muertes relacionadas con el alcohol? 
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Procedimiento FREO 
Muertes 


Frecuencias Porcentajes 

Muertes Frecuencias Porcentaje acumuladas acumulados 

íffffffffífífffffíífffffífffffffffffffffíífííffffíífffffffí 


20 

2 

3.92 

2 

3.92 

30 

2 

3.92 

4 

7.84 

40 

1 

1.96 

5 

9.80 

50 

2 

3.92 

7 

13.73 

60 

3 

5.88 

10 

19.61 

70 

1 

1.96 

11 

21.57 

80 

2 

3.92 

13 

25.49 

90 

1 

1.96 

14 

27.45 

110 

1 

1.96 

15 

29.41 

120 

3 

5.88 

18 

35.29 

150 

2 

3.92 

20 

39.22 

170 

2 

3.92 

22 

43.14 

180 

1 

1.96 

23 

45.10 

200 

1 

1.96 

24 

47.06 

230 

2 

3.92 

26 

50.98 

240 

1 

1.96 

27 

52.94 

260 

1 

1.96 

28 

54.90 

280 

1 

1.96 

29 

56.86 

290 

1 

1.96 

30 

58.82 

310 

1 

1.96 

31 

60.78 

320 

1 

1.96 

32 

62.75 

340 

1 

1.96 

33 

64.71 

360 

1 

1.96 

34 

66.67 

370 

1 

1.96 

35 

68.63 

390 

1 

1.96 

36 

70.59 

420 

2 

3.92 

38 

74.51 

460 

2 

3.92 

40 

78.43 

490 

1 

1.96 

41 

80.39 

500 

1 

1.96 

42 

82.35 

510 

1 

1.96 

43 

84.31 

520 

1 

1.96 

44 

86.27 

540 

2 

3.92 

46 

90.20 

580 

1 

1.96 

47 

92.16 

630 

1 

1.96 

48 

94.12 

1470 

1 

1.96 

49 

96.08 

1560 

1 

1.96 

50 

98.04 

1710 

1 

1.96 

51 

100.00 


Figura 3-4 SAS, resultados del procedimiento FREQ para la cantidad de decesos relacionados con el alcohol. 


SOLUCIÓN 

Estos datos son bimodales y las modas son 60 y 120. Esto se encuentra al observar los resultados de SAS, donde se nota 
que la frecuencia, tanto de 60 como de 120, es 3, que es mayor que todas las demás frecuencias. 


3.33 A Igunos paquetes de software para estadística tienen rutinas para encontrar la moda, pero en los casos en los 
que los datos son multlmodales, no dan todas las modas. En la figura 3-5 considerar el resultado que se obtiene 
con SPSS. 

¿Qué hace SPSS cuando se le pide que encuentre las modas? 
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M uertes 



Frecuencias 

Porcentaje 

Porcentajes válidos 

Porcentajes 

acumulados 

Válido 20.00 

2 

3.9 

3.9 

3.9 

30.00 

2 

3.9 

3.9 

7.8 

40.00 

1 

2.0 

2.0 

9.8 

50.00 

2 

3.9 

3.9 

13.7 

60.00 

3 

5.9 

5.9 

19.6 

70.00 

1 

2.0 

2.0 

21.6 

80.00 

2 

3.9 

3.9 

25.5 

90.00 

1 

2.0 

2.0 

27.5 

110.00 

1 

2.0 

2.0 

29.4 

120.00 

3 

5.9 

5.9 

35.3 

150.00 

2 

3.9 

3.9 

39.2 

170.00 

2 

3.9 

3.9 

43.1 

180.00 

1 

2.0 

2.0 

45.1 

200.00 

1 

2.0 

2.0 

47.1 

230.00 

2 

3.9 

3.9 

51.0 

240.00 

1 

2.0 

2.0 

52.9 

260.00 

1 

2.0 

2.0 

54.9 

280.00 

1 

2.0 

2.0 

56.9 

290.00 

1 

2.0 

2.0 

58.8 

310.00 

1 

2.0 

2.0 

60.8 

320.00 

1 

2.0 

2.0 

62.7 

340.00 

1 

2.0 

2.0 

64.7 

360.00 

1 

2.0 

2.0 

66.7 

370.00 

1 

2.0 

2.0 

68.6 

390.00 

1 

2.0 

2.0 

70.6 

420.00 

2 

3.9 

3.9 

74.5 

460.00 

2 

3.9 

3.9 

78.4 

490.00 

1 

2.0 

2.0 

80.4 

500.00 

1 

2.0 

2.0 

82.4 

510.00 

1 

2.0 

2.0 

84.3 

520.00 

1 

2.0 

2.0 

86.3 

540.00 

2 

3.9 

3.9 

90.2 

580.00 

1 

2.0 

2.0 

92.2 

630.00 

1 

2.0 

2.0 

94.1 

1 470.00 

1 

2.0 

2.0 

96.1 

1 560.00 

1 

2.0 

2.0 

98.0 

1 710.00 

1 

2.0 

2.0 

100.0 

Total 

51 

100.0 

100.0 



Estadística 


Muertes 


N Válido 

51 

Equivocado 

0 

Moda 

60.00 a 


a Hay múltiples modas. Se muestra el valor más pequeño. 

Figura 3-5 SPSS, resultado para las muertes relacionadas con el alcohol. 
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SOLUCIÓN 

SPSS da la moda más pequeña. Pero se puede inspeccionar la distribución de frecuencias y hallar las modas de la misma 
manera que con SAS (ver el resultado dado antes). 


RELACIÓN EMPÍRICA ENTRE LA M EDIA, LA M E DIANA Y LA M ODA 

3.34 a) Emplear la fórmula empírica media - moda = 3(medla - mediana) para hallar el salarlo modal délos 65 

empleados de la empresa P& R. 

b) Comparar el resultado con la moda obtenida en el problema 3.33. 

SOLUCIÓN 

a) De acuerdo con los problemas 3.23 y 3.30 se tiene media = $279.77 y mediana = $279.06. Por lo tanto, 

M oda = media - 3(media - mediana) = $279.77 - 3($279.77 - $279.06) = $277.64 

b) De acuerdo con el problema 3.33, el salario modal es $277.50, de manera que en este caso coincide con el resultado 
empírico. 

LA MEDIA GEOMÉTRICA 

3.35 Encontrar: a) la media geométrica y b) la media aritmética délos números 3, 5, 6, 6, 7,10 y 12. Se supone que 
los números son exactos. 

SOLUCIÓN 

a) M edia geométrica = G = ^/(3)(5)(6)(6)(7)( 10)(12) =^453 600. Empleando logaritmos comunes, log G = 
\ log 453 600 = ^(5.6567) = 0.8081 y G = 6.43 (a la centésima más cercana). Otra posibilidad es usar una calcu¬ 
ladora. 

Otro método 

logG = ^(log3 + log 5 4- log6 -)- logó + log 7 + log 10 + log 12) 

= ^ (0.4771 + 0.6990 + 0.7782 + 0.7782 + 0.8451 + 1.0000+ 1.0792) 

= 0.8081 

y G = 6.43 

b ) M edia aritmética = Z = ) (3+ 5 + 6 + 6 + 7 + 10+12) = 7. Esto ilustra que la media geométrica de un conjunto 
de números positivos, no todos iguales, es menor que su media aritmética. 

3.36 Los númerosXi, X 2 ,..., X K se presentan con frecuencias f v donde f 1 + f 2 + .+ f K = N es la fre¬ 

cuencia total. 

a) Encontrar la media geométrica G de estos números. 

b) Deducir una expresión para log G. 

c) ¿Cómo se pueden emplear los resultados para hallar la media geométrica de datos agrupados en una dis¬ 
tribución de frecuencias? 

SOLUCIÓN 

a) G = ■ ■ X x X 2 X 2 - ■ ■ X 2 --- X K X K - ■X K = ■ ■ ■ x f ¿ 

veces f 2 veces f K veces 

donde N = J2 f- A esta media suele llamársele media geométrica ponderada. 
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b ) 


log G = ^ log (. x{' X{ 2 ■ ■ ■ X [ K ) = ^ (/, log X x + f 2 log X 2 + ■ ■ ■ + f K log X K ) 


j= i 


E/ lQ g^ 

N 


donde se supone que todos los números son positivos; de otra manera, los logaritmos no están definidos. 

Obsérvese que el logaritmo de una media geométrica de un conjunto de números positivos es la media aritmé¬ 
tica de los logaritmos de los números. 

c) AI hallar la media geométrica de datos agrupados, este resultado puede emplearse tomando X x , X 2 ,..., X K como las 
marcas de clase y f v f 2 ,..., f K como sus frecuencias correspondientes. 


3.37 Durante un año la relación entre precios de un cuarto de galón de leche respecto a precios de una barra de pan 
fue 3.00, en tanto que al año siguiente la relación fue 2.00. 

a) Encontrar la media aritmética de esta relación en estos dos años. 

b) Encontrar la media aritmética de las relaciones ahora entre los precios de una barra de pan respecto a los 
precios de un cuarto de galón de leche en este periodo de 2 años. 

c) Analizar la conveniencia de emplear la media aritmética para promediar relaciones. 

d) Analizar la Idoneidad de la media geométrica para promediar relaciones. 


SOLUCIÓN 

a) M edia de las relaciones (cocientes) precio de leche respecto a precios de pan = ¿(3.00 + 2.00) = 2.50. 

b) Como el primer año la relación entre precios de leche respecto a precios de pan es 3.00, la relación entre precios de 
pan respecto a precios de leche es 1/3 = 0.333. De igual manera, la relación entre precios de pan y precios de leche 
el segundo año es 1/2.00 = 0.500. 

Por lo tanto, 

M edia de las relaciones (cocientes) precio de pan respecto a precios de leche = ¿(0.333 + 0.500) = 0.417 

c) Si la media fuera un promedio adecuado, se esperaría que la media de las relaciones de precios de leche respecto a 
precios de pan fuera el recíproco de la media de las relaciones precios de pan respecto a precios de leche. Sin embar¬ 
go, 1/0.417 = 2.40 # 2.50. Esto demuestra que la media no es un promedio adecuado para (cocientes) relaciones. 

d) La media geométrica de las relaciones entre precios de leche respecto a precios de pan = ^/(3.00)(2.00) = \/6.00 

La media geométrica de las relaciones entres precios de pan respecto a precios de leche = v/(0.333)(0.500) = 
V0.0167 = l/v/ó/OO 

Dado que estos promedios son recíprocos, se concluye que la media geométrica es más adecuada que la media arit¬ 
mética para promediar relaciones (cocientes). 

3.38 La cuenta bacteriana en cierto medio de cultivo aumentó de 1 000 a 4 000 en 3 días. ¿Cuál es el Incremento 
porcentual promedio por día? 


SOLUCIÓN 


Como un incremento de 1 000 a 4 000 es un incremento de 300%, uno está inclinado a concluir que el aumento porcentual 
promedio por día es 300%/3 = 100%. Sin embargo, esto significaría que el primer día la cuenta aumentó de 1 000 a 2 000, 
el segundo día de 2 000 a 4 000 y el tercer día de 4 000 a 8 000, lo cual no es así. 

Para determinar este incremento porcentual promedio se denotará r a este incremento porcentual promedio. 
Entonces 

Cuenta bacteriana total un día después = 1 000 + 1 OOOr = 1 000(1 + r) 

Cuenta bacteriana total dos días después = 1 000(1 + r) + 1 000(1 + r)r = 1 000(1 + r) 2 
Cuenta bacteriana total tres días después = 1 000(1 + r) 2 + 1 000(1 + r) 2 r = 1 000(1 + r) 3 

Esta última expresión debe ser igual a 4 000. De manera que 1 000(1 + r) 3 = 4 000, (1 + r) 3 = 4, 1 + r = fá, y 
r = fá- 1 = 1.587 - 1 = 0.587, y así, r = 58.7%. 
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En general, si se parte de una cantidad P y se incrementa esta cantidad a una tasa constante r por unidad de tiempo, 
la cantidad que se tendrá después de n unidades de tiempo será 

A = P{\ + rf 

A esta fórmula se le llama fórmula del Interés compuesto (ver problemas 3.94 y 3.95). 


LA MEDIAARMONICA 

3.39 Encontrar la media armónica H de los números 3, 5, 6, 6, 7,10 y 12. 

SOLUCIÓN 



2 940 


y H= 2 940 = 5.87 
y 501 


Suele ser mejor expresar primero las fracciones en forma decimal. Así 

i (0.3333 + 0.2000 + 0.1667 + 0.1667 + 0.1429 + 0.1000 + 0.0833) 

1.1929 
7 


Comparando con los resultados del problema 3.35 se ilustra el hecho de que la media armónica de números positivos, 
no todos iguales, es menor que su media geométrica, la que a su vez es menor que su media aritmética. 


1 

H 


H = 


3.40 Durante cuatro años consecutivos los precios del fuel para la calefacción son $0.80, $0.90, $1.05 y $1.25 por 
galón (gal). ¿Cuál es el precio promedio del fuel en estos cuatro años? 

SOLUCIÓN 

Caso 1 

Supóngase que todos los años se compra la misma cantidad de fuel, digamos 1 000 gal. Entonces 


Precio promedio 


precio total 

cantidad total comprada 


$800 + $900 + $1 050 + $1 250 
4 000 gal 


$1.00/gal 


Esto es lo mismo que la media aritmética del costo por galón; es decir j($0.80 + $0.90 + $1.05 + $1.25) = 1.00/gal. Este 
resultado sería el mismo aun cuando se usaran x galones por año. 


Caso 2 

Supóngase que en el fuel se gasta la misma cantidad de dinero todos los años, o sea $1 000. Entonces 


Precio promedio 


precio total 

cantidad total comprada 


$4 000 

(1 250+ 1 111 + 952 + 800)gal 


$0.975/gal 
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Esto es lo mismo que la media armónica de los precios por galón: 


0.80 + 0.90 + 1.05 + 1.25 

EI resultado será el mismo si se gastan y dólares por año. 

A mbos promedios son correctos, pero se calculan para condiciones diferentes. 

Debe notarse que si la cantidad de galones empleados varía de un año a otro, en vez de ser siempre la misma, en 
lugar de la media aritmética ordinaria usada en el caso 1, hay que usar la media aritmética ponderada. De manera similar, 
si la cantidad gastada varía de un año a otro, en lugar de la media armónica empleada en el caso 2 se debe usar la media 
armónica ponderada. 


3.41 Un automóvil recorre 25 mi II as a 25 millas por hora (mph), 25 mi lias a 50 mph y 25 millas a 75 mph. Encontrar 
la media aritmética de lastres velocidades y la media armónica de las tres velocidades. ¿Cuál es correcta? 

SOLUCIÓN 

La velocidad promedio es igual a la distancia recorrida dividida entre el total del tiempo y es igual a lo siguiente: 

= 40.9 mi/h 


1+ Í + I 


La media aritmética de las tres velocidades es: 


25 + 5 „ 0 + 75 = 5Q mi /h 


L a media armónica se encuentra como sigue: 


i i_i/j_ i n _ ii 

H~ N^X~ 3 125 + 50 + 75/ “450 


H = ^ = 40.9 


La media armónica es la medida correcta de la velocidad promedio. 


LARAÍZ CUADRADA M EDI A O M E DIA C UADRÁTIC A 

3.42 Encontrar la media cuadrática de los números 3, 5, 6, 6, 7,10 y 12. 

SOLUCIÓN 

Media cuadrática = RCM = + 5 ' + 6 ' + ^ 7 ' + 1Q2 + 12 - = Víi = 7.55 

3.43 Demostrar que la media cuadrática de dos números positivos distintos a y b es mayor que su media geomé¬ 
trica. 

SOLUCIÓN 

Se pide que se demuestre que \J\{a 2 + b 2 ) > Vab. Si esto es verdad, entonces elevando al cuadrado ambos miembros 

5(a 2 + ó 2 ) >ab, de manera que a 2 + b 2 > 2 ab, a 2 - 2ab 2 + b 2 > 0 o bien (a - b) 2 > 0. Pero esta Igualdad es cierta, ya 
que el cuadrado de cualquier número real distinto de cero es positivo. 
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La prueba consiste en demostrar el proceso inverso. Entonces, partiendo de (a - b) 2 > 0, que se sabe que es verda¬ 
dero, se puede mostrar que a 2 + b 2 > 2ab, \ (a 2 + b 2 ) >aby finalmente \JUa 2 + b 2 ) > \fab, que es lo pedido. 
Obsérvese que (a 2 + b 2 ) = Vab si y sólo si a = b. 


CUARTILES, DECILESY PERCENTILES 

3.44 Para los salarios de los 65 empleados de la empresa P& R (ver problema 2.9), encontrar: a) los cuarti les Q i, Q 2 
y0 3 y b) losdecilesD 11 D 2 ,...,D 9 . 


SOLUCIÓN 

a) El primer cuartiI 0 x es el salario que se encuentra contando N/4 = 65/4 = 16.25 de los casos, comenzando con la 
primera clase (la más baja). Como la primera clase contiene 8 casos, hay que tomar 8.5 (16.25 - 8) casos de los 10 de 
la segunda clase. U sando el método de interpolación lineal, se tiene 

Q, = $259.995-l- 8 ^ 5 ($10.00) = $268.25 

El segundo cuartiI Q 2 se encuentra contando los primeros 2A//4 = W/2 = 65/2 = 32.5 de los casos. Como las 
primeras dos clases comprenden 18 casos, se deben tomar 32.5 - 18 = 14.5 casos de los 16 de la tercera clase, por lo 
tanto 


Q 2 = $269.995 + 


14.5 

16 


($10.00) = $279.06 


Obsérvese que 0 2 es la mediana. 

El tercer cuartil Q 3 se encuentra contando los primeros 3N/4 = |(65) = 48.75 de los casos. Como las primeras 
cuatro clases comprenden 48 casos, se deben tomar 48.75 - 48 = 0.75 casos de los 10 de la quinta clase; por lo tanto 

Q 3 = $289.995 + ^ ($10.00) = $290.75 

Así, 25% de los empleados ganan $268.25 o menos, 50% gana $279.06 o menos y 75% gana $290.75 o 
menos. 

b) Los deciles primero, segundo,..., y noveno se obtienen contando N /10, 2A//10,..., 9N/10 de los casos empezando 
por la primer clase (inferior). Por lo tanto 


D t = $249.995 + ^ ($10.00) = $258.12 
8 

D 2 = $259.995 + ^ ($10.00) = $265.00 

Z> 3 = $269.995 +^($10.00) = $270.94 
16 

£>4 = $269.995 + ($10.00) = $275.00 

16 

D s = $269.995 + ^ ($10.00) = $279.06 


D 6 = $279.995 + —($10.00) = $283.57 
Z> 7 = $279.995 + ^ ($10.00) = $288.21 
D s = $289.995 + ^ ($10.00) = $294.00 
D 9 = $299.995+ ^($10.00) = $301.00 


De manera que 10% délos empleados gana $258.12 o menos, 20% gana $265.00 o menos,..., 90% gana $301.00 
o menos. 

Obsérvese que el quinto decil es la mediana. Los deciles segundo, cuarto, sexto y octavo, quedividen la distri¬ 
bución en cinco partes iguales y a los que se les IIama quintiles, también suelen usarse en la práctica. 
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3.45 En la distribución del problema 3.44, determinara) el percentil 35o. y b) el percentiI 60o. 

SOLUCIÓN 

a) El percentil 35o., que se denota P 35 , se obtiene contando los primeros 35A//100 = 35(65)/100 = 22.75 casos, empe¬ 
zando en la primera clase (la clase más baja). Entonces, como en el problema 3.44, 

P 35 = $269.995 + ^ ($10.00) = $272.97 
16 

Esto significa que 35% de los empleados gana $272.97 o menos. 

b ) El percentil 60o. es P 60 = $279.995 +^($10.00) = $283.57. Obsérvese que éste coincide con el sexto decil o tercer 
quintil. 

3.46 La siguiente hoja de cálculo de EX C EL está contenida en A 1:D 26. Esta hoja de cálculo contiene el Ingreso per 
cápita en cada uno de los 50 estados de Estados Unidos. Dar los comandos de EXCEL para hallar Q x , Q 2 , Q 3 
yPgs- Dar también los estados que están a ambos lados de estos cuartlles o percenti les. 


Estado 

Ingreso per cápita 

Estado 

Ingreso per cápita 

Wyoming 

36 778 

Pennsylvania 

34 897 

Montana 

29 387 

Wisconsin 

33 565 

North Dakota 

31 395 

Massachusetts 

44 289 

New México 

27 664 

Missouri 

31 899 

West Virginia 

27 215 

Idaho 

28 158 

Rhode Island 

36 153 

Kentucky 

28 513 

Virginia 

38 390 

Minnesota 

37 373 

South Dakota 

31 614 

Florida 

33 219 

Alabama 

29 136 

South Carolina 

28 352 

Arkansas 

26 874 

New York 

40 507 

Maryland 

41 760 

Indiana 

31 276 

lowa 

32 315 

Connecticut 

47 819 

Nebraska 

33 616 

Ohio 

32 478 

Hawaii 

34 539 

New Hampshire 38 408 

Mississippi 

25 318 

Texas 

32 462 

Vermont 

33 327 

Oregon 

32 103 

Maine 

31 252 

New J ersey 

43 771 

Oklahoma 

29 330 

California 

37 036 

Delaware 

37 065 

Colorado 

37 946 

Alaska 

35 612 

North Carolina 

30 553 

Tennessee 

31 107 

Illinois 

36 120 

Kansas 

32 836 

Michigan 

33 116 

Arizona 

30 267 

Washington 

35 409 

Nevada 

35 883 

Georgia 

31 121 

Utah 

28 061 

Louisiana 

24 820 

CIÓN 



Estados más cercanos 

=P E RC ENTILE (A2:D26,0.2 5) 

$30 338.5 

Arizona y NorthCarolina 

=P E RC ENTILE (A2:D26,0.50) 

$32 657 

Ohio y Kansas 

=P E RC ENTILE (A2:D26,0.75) 

$36 144.75 

Illinois y Rhodelsland 

=PERCENTILE(A2:D26,0.95) 

$42 866.05 

Maryland y NewJ ersey 
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PROBLEMAS SUPLEMENTARIOS 


SUMATORIA 


3.47 


Escribir los términos de cada una de las sumas siguientes: 


a) £(*} + 2) 
7=i 

b) Í2/J X J 

j =1 


3 4 

c) ££7/^ + 6) e) ^4X y F y 

7=1 7=1 

d) 

k=l 


3.48 Escribir cada una de las sumas siguientes usando el signo de sumatoria: 

a) ( X\ + 3)' -(- (X2 + 3) + (X 3 + 3) 

b) Mr, — ay + Mr2 — <M + ■ ■ ■ + M(r xi — á)~ 

c) (2X¡ — 3 F¡) + ( 2 X 2 — 3 Y 2 ) + • • ■ + {2X ¡v — 3 F^y) 

d) (X,/Y i - l) 2 + (X 2 /Y 2 - l) 2 + ... + (X 8 /F 8 - l) 2 

e) ./jal + fiaí + • ■ ■ + fu^n 

f, + fi 4 -+ /12 

3.49 Demostrar que E£i Mj - l ) 2 = Ey=i %j ~ 2 E./=i *,• + AT 


3.50 Demostrar que E (^4- a)(F + b ) = + a E Y + bJ 2 x + Nab , donde a y b son constantes. ¿Cuáles son los 

subíndices implícitos? 


3.51 Las variables U y V toman los valores U 1 = 3, U 2 = -2, U 3 = 5 y \/ l = -4, V 2 = -1, V 3 = 6, respectivamente. Calcular 
a) J2U V, b) E(U + 3)(V - 4), c) E V 2 ,d) (E U )(E' / ) 2 ' e)J2UV 2 ,f) ¿2(U 2 - 21/ 2 + 2) y g) £(U/ V). 

3.52 Dado que Ey=i= 7, Ey=i Y¡ = -3 y 'Ej=\ x j Y¡= encontrar a) Ey=i (2X ; - + 5 Yj) y b) Ey=i(X ; - 3)(2F y + 1). 


LA M EDIA ARITM ÉTICA 

3.53 En cinco materias, un estudiante obtuvo las calificaciones siguientes: 85, 76, 93, 82 y 96. Determinar la media aritmética 
de estas calificaciones. 

3.54 U n psicólogo mide los tiempos de reacción de un individuo a ciertos estímulos: éstos fueron 0.53, 0.46, 0.50, 0.49,0.52, 
0.53, 0.44 y 0.55 segundos, respectivamente. Estimar el tiempo medio de reacción del individuo a estos estímulos. 

3.55 U n conjunto de números consta de 6 seises, 7 sietes, 8 ochos, 9 nueves y 10 dieces. ¿Cuál es la media aritmética de estos 
números? 

3.56 U n estudiante obtuvo las calificaciones siguientes en tres aspectos de un curso: 71, 78 y 89, respectivamente. 

a) Si los pesos que se acuerda dar a estas calificaciones son 2, 4 y 5, respectivamente, ¿cuál es una calificación promedio 
apropiada? 

b) ¿Cuál es la calificación promedio si se usan pesos iguales? 

3.57 Los promedios de calificación en los cursos de tres maestros de economía son 79, 74 y 82, y sus grupos constan de 32, 25 
y 17 alumnos, respectivamente. Determinar la calificación media de los tres cursos. 
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3.58 EI salario anual medio pagado a los empleados de una empresa es $36 000. L os salarlos anuales medios pagados a hombres 
y mujeres de la empresa son $34 000 y $40 000, respectivamente. Determinar el porcentaje de hombres y mujeres emplea¬ 
dos por la empresa. 


3.59 En la tabla 3.8 se presenta la distribución de las cargas máximas, en toneladas cortas (1 tonelada corta = 2 000 Ib) que 
soportan ciertos cables producidos por una empresa. Determinar la carga máxima media usando: a) el método largo y b ) el 
método de compilación. 


Tabla 3.8 


Carga máxima 
(toneladas cortas) 

Cantidad de 
cables 

9.3-9.7 

2 

9.8-10.2 

5 

10.3-10.7 

12 

10.8-11.2 

17 

11.3-11.7 

14 

11.8-12.2 

6 

12.3-12.7 

3 

12.8-13.2 

1 


Total 60 


3.60 Encontrar X para los datos de la tabla 3.9 usando: a) el método largo y b) el método de compilación. 

Tabla 3.9 


X 

462 

480 

498 

516 

534 

552 

570 

588 

606 

624 

f 

98 

75 

56 

42 

30 

21 

15 

11 

6 

2 


3.61 E n la tabla 3.10 se presenta la distribución de los diámetros de las cabezas de remaches producidos por una empresa. Calcular 
el diámetro medio. 


3.62 Calcular la media de los datos de la tabla 3.11. 

Tabla 3.10 Tabla 3.11 


Diámetro (cm) 

Frecuencias 

0.7247-0.7249 

2 

0.7250-0.7252 

6 

0.7253-0.7255 

8 

0.7256-0.7258 

15 

0.7259-0.7261 

42 

0.7262-0.7264 

68 

0.7265-0.7267 

49 

0.7268-0.7270 

25 

0.7271-0.7273 

18 

0.7274-0.7276 

12 

0.7277-0.7279 

4 

0.7280-0.7282 

1 


Total 250 


Clase 

Frecuencias 

10 hasta menos de 15 

3 

15 hasta menos de 20 

7 

20 hasta menos de 25 

16 

25 hasta menos de 30 

12 

30 hasta menos de 35 

9 

35 hasta menos de 40 

5 

40 hasta menos de 45 

2 


Total 54 


























Problemas suplementarios 91 


3.63 Calcular la media de la cantidad de tiempo que ven televisión los 400 estudiantes del problema 2.20. 

3.64 a) Emplear la distribución de frecuencias del problema 2.27 para calcular el diámetro medio de los balines. 

b) Calcular la media directamente de los datos en bruto y compararla con el inciso a); explicar cualquier discrepancia. 

LA MEDIANA 

3.65 Encontrar la media y la mediana de estos conjuntos de números: a) 5, 4, 8, 3, 7, 2, 9 y b) 18.3, 20.6,19.3, 22.4, 20.2,18.8, 
19.7,20.0. 

3.66 Encontrar la calificación mediana del problema 3.53. 

3.67 Encontrar el tiempo mediano de reacción del problema 3.54. 

3.68 Encontrar la mediana del conjunto de números del problema 3.55. 

3.69 Encontrar la mediana de la carga máxima de los cables de la tabla 3.8 del problema 3.59. 

3.70 Encontrar la mediana X de la distribución presentada en la tabla 3.9 del problema 3.60. 

3.71 Encontrar el diámetro mediano de las cabezas de los remaches de la tabla 3.10 del problema 3.61. 

3.72 Encontrar la mediana de la distribución presentada en la tabla 3.11 del problema 3.62. 

3.73 En la tabla 3.12 se da la cantidad, en miles, de muertes en Estados Unidos ocurridas en 1993 a causa de enfermedades 
cardiacas. Encontrar la edad mediana. 


Tabla 3.12 


Grupo de edad 

M ¡les de muertes 

Total 

743.3 

M enos de 1 

0.7 

1 a 4 

0.3 

5 a 14 

0.3 

15 a 24 

1.0 

25 a 34 

3.5 

35 a 34 

13.1 

45 a 54 

32.7 

55 a 64 

72.0 

65 a 74 

158.1 

75 a 84 

234.0 

85 y más 

227.6 


Fuente: U.S. National Centerfor Health Statlstics, Vital 
Statlsticsof the U.S., annual. 


3.74 Con los datos de la tabla del problema 2.31 encontrar la edad mediana. 

3.75 Encontrar la mediana de la cantidad de tiempo que ven la televisión los 400 estudiantes del problema 2.20. 
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LA MODA 

3.76 Encontrar la media, la mediana y la moda de cada uno de los conjuntos de números siguientes: a) 7, 4,10, 9,15,12, 7, 9, 
7 y b) 8,11, 4, 3, 2, 5,10, 6, 4,1,10, 8,12, 6, 5, 7. 

3.77 En el problema 3.53 encontrar la calificación modal. 

3.78 En el problema 3.54 encontrar el tiempo de reacción modal. 

3.79 En el problema 3.55 encontrar la moda del conjunto de números. 

3.80 En el problema 3.59 encontrar la moda de la carga máxima de los cables. 

3.81 En el problema 3.60 encontrar la moda X de la distribución dada en la tabla 3.9. 

3.82 En el problema 3.61 encontrar el diámetro modal de las cabezas de los remaches de la tabla 3.10. 

3.83 En el problema 3.62 encontrar la moda de la distribución dada. 

3.84 En el problema 2.20 encontrar la moda de la cantidad de tiempo que ven televisión los 400 estudiantes. 

3.85 a) ¿Cuál es el grupo de edad modal en la tabla 2.15? 

b ) ¿Cuál es el grupo de edad modal en la tabla 3.12? 

3.86 Empleando las fórmulas (9) y (10) de este capítulo, hallar la moda de las distribuciones dadas en los problemas siguientes. 
Comparar las respuestas obtenidas con cada una de las dos fórmulas. 

a) Problema 3.59 ó) Problema 3.61 c) Problema 3.62 d) Problema 2.20. 

3.87 La probabilidad de una variable aleatoria continua está descrita por la siguiente función de densidad de probabilidad. 

f[x) = -0.75x 2 + 1.5x para 0 <x < 2 y para todos los demás valores dex, f(x) = 0. La moda se presenta en el punto en el 

que la función alcanza su máximo. Empleando los conocimientos sobre funciones cuadráticas, mostrar que la moda se 

presenta en x = 1. 

LA MEDIA GEOMÉTRICA 

3.88 Hallar la media geométrica de los números: a) 4.2 y 16.8 y b) 3.00 y 6.00. 

3.89 Hallar: a) la media geométrica G y b) la media aritmética X del conjunto 2, 4, 8,16, 32. 

3.90 Hallar la media geométrica de los conjuntos: a) 3, 5, 8, 3, 7, 2 y b) 28.5, 73.6, 47.2, 31.5, 64.8. 

3.91 Hallar la media geométrica de las distribuciones de: a) el problema 3.59 y b ) el problema 3.60. Verificar que en estos casos 

la media geométrica es menor o igual a la media aritmética. 


3.92 Si en un periodo de 4 años se duplican los precios de un artículo, ¿cuál es el incremento porcentual anual promedio? 
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3.93 En 1980 y 1996 la población de Estados U nidos era de 226.5 millones y 266.0 millones, respectivamente. Empleando la 
fórmula dada en el problema 3.38, contestar lo siguiente. 

a) ¿Cuál es el incremento porcentual anual promedio? 

b ) Estimar la población en 1985. 

c) SI el Incremento porcentual anual promedio de 1996 a 2000 es el mismo que en el Inciso a), ¿a cuánto ascenderá la 
población en 2000? 

3.94 Se invierten $1 000 a una tasa de interés anual de 8%. ¿A cuánto ascenderá la cantidad total después de 6 años si no se 
retira el capital inicial? 

3.95 SI en el problema 3.94 el Interés es compuesto trimestralmente (es decir, el dinero gana 2% de interés cada 3 meses), ¿cuál 
será la cantidad total después de 6 años? 

3.96 Encontrar dos números cuya media aritmética sea 9.00 y cuya media geométrica sea 7.2. 


LA MEDIAARMÓNICA 

3.97 Encontrar la media armónica de los números: a) 2, 3 y 6 y b) 3.2, 5.2, 4.8, 6.1 y 4.2. 

3.98 Encontrar: a) la media aritmética, b ) la media geométrica y c) la media armónica de los números 0, 2, 4 y 6. 


3.99 Si X v X 2 , X 3 ,. son las marcas de clase de una distribución de frecuencias y f v f 2 , son sus frecuencias correspon¬ 
dientes, demostrar que su media armónica está dada por 


1 

H 


1 

Ñ 


A+A+ 

X, x 2 




/ 

X 


donde N — f 3 + f 2 + ■ • * J2 f 


3.100 Emplear el problema 3.99 para hallar la media armónica de la distribución: a) del problema 3.59 y b) del problema 3.60. 
Comparar con el problema 3.91. 

3.101 Las ciudades A, 6 y C están equidistantes una de otra. Un conductor viaja de la ciudad A a la ciudad 6 a 30 mi/h, de la 
ciudad 6 a la ciudad C a 40 mi/h y de la ciudad C a la ciudad A a 50 mi/h. Determinar su velocidad promedio en este 
viaje. 


3.102 a) Un aeroplano recorre las distancias d v d 2 y d 3 a las velocidades v h v 2 y v 3 mi/h, respectivamente. M ostrar que la 

velocidad promedio está dada por V, donde 

d\ ~\~ d 2 ~\~ d 3 d\ d 2 

V v x v 2 v 3 

Ésta es una media armónica ponderada. 

b ) E ncontrar: V si d 3 s* 2 500, d 2 = 1 200, d 3 = 500, v 3 = 500, v 2 = 400 y v 3 = 250. 

3.103 Demostrar que la media geométrica de dos números a y b es: a) menor o Igual que su media aritmética y b) mayor o Igual 
que su media armónica. ¿Puede generalizar la prueba a más de dos números? 
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LA RAÍZ CUADRADA ME DIA 0 LA M E DIA C UADRÁTICA 

3.104 Encontrar la RCM (o media cuadrática) de los números: a) 11, 23 y 35, y b ) 2.7, 3.8, 3.2 y 4.3. 

3.105 Probar que la RCM de dos números positivos, a y b, es: a) mayor o igual que la media aritmética y b) mayor o igual que la 
media armónica. Se puede extender la prueba a más de dos números. 

3.106 Deducir una fórmula que pueda usarse para hallar la RCM de datos agrupados y aplicarla a una de las distribuciones de 
frecuencias ya consideradas. 


CUARTILES, DEC I LES Y PE RC ENTIL ES 

3.107 En la tabla 3.13 se presenta una distribución de frecuencias de las calificaciones en un examen final de álgebra, a) Encontrar 
los cuartiles de esta distribución y b ) interpretar claramente cada uno de ellos. 

Tabla 3.13 


Calificación 

Cantidad de 
estudiantes 

90-100 

9 

80-89 

32 

70-79 

43 

60-69 

21 

50-59 

11 

40-49 

3 

30-39 

1 


Total 120 


3.108 Encontrar los cuartiles Q 1( Q 2 y Q 3 de las distribuciones: a) del problema 3.59 y b) del problema 3.60. Interpretar clara¬ 
mente cada uno de ellos. 

3.109 Proporcionar seis términos estadísticos diferentes para el punto de equilibrio o valor central en una curva de frecuencias en 
forma de campana. 

3.110 Encontrar: a) P 10 , b) P 90 , c) P 25 y d) P 75 en los datos del problema 3.59. Interpretar claramente cada uno de ellos. 

3.111 a) ¿Se pueden expresar todos los deciles y cuartiles como percentiles? Explicar. 

b ) ¿Se pueden expresar los cuantiles como percentiles? Explicar. 

3.112 Para los datos del problema 3.107, determinar: a) la calificación más baja obtenida por el 25% superior de los alumnos y 
b) la puntuación más alta alcanzada por el 20% inferior de los alumnos. Interpretar las respuestas en términos de percen¬ 
tiles. 

3.113 Interpretar gráficamente los resultados del problema 3.107 empleando: a) un histograma porcentual, b) un polígono de 
frecuencia porcentual y c) una ojiva porcentual. 

3.114 Repetir el problema 3.113 para los resultados del problema 3.108. 

3.115 a) Desarrollar una fórmula similar a la de la ecuación (8) de este capítulo que permita calcular cualquier percentil de una 

distribución de frecuencias. 

b) Ilustrar el uso de la fórmula empleándola para obtener los resultados del problema 3.110. 









Desviación estándar 

Y OTRAS MEDIDAS 
DE DISPERSIÓN 



DISPERSIÓN O VARIACIÓN 

El grado de dispersión de los datos numéricos respecto a un valor promedio se llama dispersión o variación de los 
datos. Existen varias medidas de dispersión (o variación); las más usadas son el rango, la desviación media, el rango 
semiintercuartiI, el rango percentiI 10-90 y la desviación estándar. 


RANGO 

El rango de un conjunto de números es la diferencia entre el número mayor y el número menor del conjunto. 

EJEMPLO 1 EI rango del conjunto 2, 3, 3, 5, 5, 5, 8,10,12 es 12 - 2 = 10. A Igunas veces el rango se da mediante el número 
menor y el número mayor; así, por ejemplo, en el caso del conjunto anterior, simplemente se indica de 2 a 12 o 2-12. 


DESVIACIÓN MEDIA 


La desviación media, o desviación promedio, de un conjunto de N 
nida así: 

t\Xj-* I 

Desviación media (DM ) = --—- 


números X 1; X 2 ,...,X W se abrevia DM y está defi- 


N 


\ x -x\ 


( 1 ) 


donde X es la media aritmética de los números y |X} - X\ es el valor absoluto de la desviación deX, respecto de X. 
(El valor absoluto de un número es el número sin signo; el valor absoluto de un número se Indica por medio de dos 
barras verticales colocadas a los lados del número, así | - 4| = 4, | + 3| = 3, |6| = 6 y | - 0.84| = 0.84|.) 
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EJEMPLO 2 Encuentre la desviación media del conjunto 2, 3, 6, 8,11. 

M edia aritmética (X) =---= 6 

q |y| _ |2-6| + |3-6| + |6-6| + |8-6| + |11-6| _ | - 4| + | - 3| + |0| + |2| + |5| _ 4+3+0+2+5 = g 

Si X 1 ,X 2 ,...,X K se presentan con frecuencias f 1; f 2 , ..., f K , respectivamente, la desviación media puede expresarse 
como 


DM 




7=1 _ 

N 


N 


l*-*l 


( 2 ) 


donde jV = ^=1 fj = Esta fórmula es útil para datos agrupados, donde las X¡ representan las marcas de clase y 
las f¡ las correspondientes frecuencias de clase. 

En ocasiones, la desviación media se define en términos de las desviaciones absolutas respecto de la mediana o de 
otro promedio, y no respecto déla media. Una propiedad interesante de la suma \ x j ~ «I es que es mínima cuan¬ 
do a es la mediana (es decir, la desviación media absoluta con respecto de la mediana es un mínimo). 

Obsérvese que sería más apropiado emplear el término desviación media absoluta en vez de desviación media. 


RANGO SEMIINTERCUARTIL 

El rango semiintercuartil, o desviación cuartil, de un conjunto de datos se denota Q y está definido por 


donde y 0 3 son el primero y tercer cuartiles en los datos (ver problemas 4.6 y 4.7). Algunas veces se usa el rango 
intercuartil Q 3 - Q 1; sin embargo, el rango semiintercuartil es más usado como medida de dispersión. 

RANGO PERCENTIL 10-90 

El rango percentil 10-90 de un conjunto de datos está definido por 

Rango percentil 10-90 = P 90 - P 10 (4) 

donde P 10 y P 90 son los percentiles 10o. y 90o. en los datos (ver problema 4.8). El rango semipercentil 10-90, 
j(P 90 - Pío), también puede usarse, pero no es muy común. 

DESVIACIÓN ESTÁNDAR 

La desviación estándar de un conjunto de N números X v X 2 ,.. .,X N se denota como s y está definida por 


N 


T«-T ) 2 


s = 


E(^-Z ) 2 /£* 


N 


N 


= ^{x-xy 


(5) 


donde x representa la desviación de cada uno de los números X¡ respecto a la media X. Por lo tanto, s es la raíz cua¬ 
drada déla media (RCM ) de las desviaciones respecto de la media, o, como suele llamársele algunas veces, la desvia¬ 
ción raíz-media-cuadrado. 
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Si X lt X 2 ,...,X N se presentan con frecuencias f v f 2 ,..., f K , respectivamente, la desviación estándar se puede expre¬ 
sar como 


donde N = Y!¡=\ fj = 12 f- Esta fórmula es útil para datos agrupados. 

A Igunas veces la desviación estándar de una muestra de datos se define usando como el denominador, en las ecua¬ 
ciones (5) y (6), (N - 1) en lugar de N. Esto se debe a que el valor que así se obtiene es una mejor aproximación a la 
desviación estándar de la población de la que se ha tomado la muestra. Con valores grandes de N (N > 30), práctica¬ 
mente no hay diferencia entr e las dos def iniciones. Y cuando se necesita una estimación mejor, ésta siempre se puede 
obtener multiplicando por \/N /(N - 1) la desviación estándar obtenida de acuerdo con la primera definición. Por lo 
tanto, en este libro se emplearán las fórmulas (5) y (6). 


5 = 


'£/;(*>-?) 2 


VARIANZA 

La varianza de un conjunto de datos se define como el cuadrado déla desviación estándar y, por lo tanto, corresponde 
al valor s 2 en las ecuaciones (5) y (6). 

Cuando es necesario distinguir la desviación estándar de una población de la desviación estándar de una muestra 
obtenida de esa población, se suele emplear s para la última y a (letra griega sigma minúscula) para la primera. De 
manera ques 2 y a 2 representan la varianza muestraI y la varianza poblacional, respectivamente. 


MÉTODO ABREVIADO PARAEL CÁLCULO DE LA DESVIACIÓN ESTÁNDAR 


Las ecuaciones (5) y (6) se pueden expresar, respectivamente, mediante las fórmulas siguientes 


5 = 



= \ X 2 -X 2 


(7) 


s = 


y (t f* 

j= 1_I j= 1 

N V N 


\Yjy 

N 


Yjx' 

N 


= \ x 2 -x 2 


( 8 ) 


donde X 2 representa la media délos cuadrados délos diversos valores deX, en tanto que X 2 denota el cuadrado de la 
media de los diversos valores deX (ver problemas 4.12 a 4.14). 

SI las d¡ =X¡-A son las desviaciones deXy respecto a una constante arbitraria A, las fórmulas (7) y (8) se trans¬ 
forman, respectivamente, en 


5 = 




l=i 

V N 


2 



(9) 


s = 





( 10 ) 


(Ver los problemas 4.15 y 4.17.) 
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Cuando en una distribución de frecuencia se tienen datos agrupados y los intervalos de clase son de un mismo 
tamaño c, se tiene d,- = cu¡, o X¡ = A + cu¡ y la fórmula (10) se trasforma en 



Esta última fórmula proporciona un método muy sencillo para el cálculo de la desviación estándar y se recomienda su 
uso para datos agrupados, siempre que los Intervalos de clase sean de un mismo tamaño. A este método se le llama 
método de compilación y es exactamente análogo al empleado en el capítulo 3 para calcular la media aritmética de 
datos agrupados. (Ver problemas 4.16 a 4.19.) 

PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR 

1 . La desviación estándar se puede definir como 


N 


S = 


E (*/-«) 2 

Ñ 


donde a es un promedio cualquiera además de la media aritmética. De todas las desviaciones estándar, la mínima 
es aquella en la que a = X, debido a la propiedad 2 del capítulo 3. Esta propiedad es una razón Importante para 
definir la desviación estándar como se definió antes. En el problema 4.27 se presenta una demostración de esta 
propiedad. 

2. En las distribuciones normales (ver capítulo 7) se encuentra que (como se muestra en la figura 4.1): 

a) 68.27% de los casos está comprendido entren - sy X + s (es decir, una desviación estándar a cada lado de 
la media). 

b) 95.45% délos casos está comprendido entre X - 2s y X + 2s (es decir, dos desviaciones estándar a cada lado 
de la media). 

c) 99.73% de los casos está comprendido entren - 3sy X + 3s (es decir, tres desviaciones estándar a cada lado 
de la media). 

En distribuciones moderadamente sesgadas, estos porcentajes se satisfacen de manera aproximada (ver pro¬ 
blema 4.24). 


3. Supóngase que dos conjuntos que constan de N 1 y N 2 números (o dos distribuciones de frecuencia con frecuencias 
totales N 1 y N 2 ) tienen varianzassi y sf, respectivamente, y una misma media X. Entonces, la varianza combinada 
o conjunta de los dos conjuntos (o de las dos distribuciones de frecuencia) está dada por 


2 _ N¡ Yi + N 2 S2 
S Ni+N 2 


( 12 ) 


Obsérvese que ésta es una media aritmética ponderada de las dos vari anzas. Esta fórmula puede general Izarse a tres 
o más conjuntos. 

4. El teorema de Chebyshev establece que para k > 1, por lo menos (1 - (1/A: 2 )) x 100% de la distribución de pro¬ 
babilidad de cualquier variable está a no más de k desviaciones estándar de la media. En particular, para /c = 2, por 
lo menos (1 - (1/2 2 )) x 100% o bien 75% de los datos está en el Intervalo (x- 25, x + 25); para k = 3, por lo 
menos (1 - (1/3 2 )) x 100% u 89% de los datos está en el Intervalo (x - 35, x + 35), y para 7c = 4, por lo menos 
(1 - (1/4 2 )) x 100% o bien 93.75% de los datos está en el Intervalo (x - 45, x + 45). 
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F ¡gura 4-1 I lustración de la regla empírica. 

COMPROBACIÓN DE CHARLIER 

La comprobación de Charlier, en el cálculo de la media y de la desviación estándar mediante el método de la compila¬ 
ción, hace uso de las Identidades 

f( u + 1 ) = X)/ m + S/ = S/ m + ^ 

S f( u + l) 2 = S /(w 2 + 2u + 1) = ^2 fu 2 + 2 fu + J2 / = S /“ 2 + - S fu + N 


(Ver el problema 4.20.) 















100 Capítulo 4 Desviación estándar y otras medidas de dispersión 


CORRECCIÓN DE SHEPPARD PARA LA VARIANZA 

El cálculo de la desviación estándar tiene cierto error debido a la agrupación de los datos en clases (error de agrupa- 
miento). Para hacer un ajuste respecto al error de agrupamiento, se usa la fórmula 


Varianza corregida 


Varianza de los datos agrupados — 


r 

12 


(13) 


donde c es el tamaño del Intervalo de clase. A la corrección c 2 /12 (que se resta) se le llama corrección de Sheppard. 
Esta corrección se usa para distribuciones de variables continuas, en las que las "colas", en ambas direcciones, se 
aproximan gradualmente a cero. 

Hay discrepancia respecto a cuándo y si la corrección de Shepppard debe ser aplicada. Desde luego no debe apli¬ 
carse antes de que se examine la situación cuidadosamente, ya que se tiende a una sobrecorrección, con lo que sólo se 
sustituye un error por otro. En este libro, a menos que se Indique otra cosa, no se usará la corrección de Sheppard. 

RELACIONES EM PÍRICAS ENTRE LAS MEDIDAS DE DISPERSIÓN 

Para las distribuciones moderadamente sesgadas, se tiene la relación empírica 


Desviación media = | (desviación estándar) 


Rango semiintercuartil = | (desviación estándar) 

Esto es consecuencia de que en una distribución normal se encuentre que la desviación media y el rango semünter- 
cuartll son ¡guales, respectivamente, a 0.7979 y 0.6745 veces la desviación estándar. 

DISPERSIÓN ABSOLUTAY RELATIVA; COEFICIENTE DE VARIACIÓN 

La variación o dispersión real determinada mediante la desviación estándar u otra medida de dispersión se le conoce 
como dispersión absoluta. Sin embargo, una variación o dispersión de 10 pulgadas (in) en una distancia de 1 000 pies 
(ft) tiene un significado muy diferente a la misma variación de 10 ¡n en una distancia de 20 ft. Este efecto se puede 
medir mediante la dispersión relativa, que se define como sigue: 


, . dispersión absoluta 

Dispersión relativa =- 

promedio 


(14) 


SI la dispersión absoluta es la desviación estándar s y el promedio es la media X, entonces a la dispersión relativa 
se le llama coeficiente de variación o coeficiente de dispersión; este coeficiente se denota por V y está dado por 


Coeficiente de variación (1/) 


S 

X 


(15) 


y por lo general se expresa como porcentaje. También hay otras posibilidades (ver problema 4.30). 

Obsérvese que el coeficiente de variación es Independiente de las unidades que se empleen. Debido a esto, el coefi¬ 
ciente de variación es útil cuando se trata de comparar distribuciones en las que las unidades son diferentes. U na 
desventaja del coeficiente de variación es que no es útil cuando el valor de X es cercano a cero. 
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VARIABLE ESTANDARIZADA; PUNTUACIONES ESTÁNDAR 

A la variable que mide la desviación respecto a la media en términos de unidades de desviaciones estándar se le llama 
variable estandarizada y es una cantidad adimensional (es decir, es independiente de las unidades empleadas) y está 
dada por 


X-X 

z = - 

s 


(16) 


Si las desviaciones respecto a la media se dan en términos de unidades de desviación estándar, se dice que las 
desviaciones se expresan en unidades estándar o en puntuaciones estándar. Las unidades estándar son de gran valor 
para comparar distribuciones (ver problema 4.31). 

SOFTWARE Y MEDIDAS DE DISPERSIÓN 

El software para estadística proporciona diversas medidas de dispersión. Estas medidas de dispersión suelen propor¬ 
cionarse en estadística descriptiva. EXCEL permite el cálculo de todas las medidas estudiadas en este libro. Aquí 
se discuten M INITAB y EXCEL y en los problemas resueltos se muestran los resultados que proporcionan otros 
paquetes. 

EJEMPLO 3 

a) EXCEL proporciona cálculos para varias medidas de dipersión, y en el siguiente ejemplo se ilustran algunas de ellas. En 
una empresa se hace una encuesta; la pregunta es: ¿cuántos e-mails recibe una persona por semana? Las respuestas dadas 
por los 75 empleados se muestran en las celdas A 1:E 15 de la hoja de cálculo de EXCEL. 
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El rango se obtiene mediante =M AX (A1:E15)-M IN (A 1:E 15) o bien 125 - 24 = 101. La desviación media o desviación 
promedio se obtiene mediante = DESVPROM (A 1:E 15) o bien 24.42. El rango semiintercuartil se obtiene mediante la 
expresión =(PERCENTIL(A 1:E 15,0.75)-(PERCENTIL(A 1:E 15,0.25))/2 o bien 22. El rango percentil 10-90 se obtiene 
mediante PERCENTIL(A 1:E15,0.9)-PERC ENTIL (A 1:E 15,0.1) u 82.6. 

La desviación estándar y la varianza se obtienen mediante =DESVEST (ALE 15), que es 29.2563 y =VA R(A 1:E 15), 
que es 855.932 para muestras, y =DESV ESTP(A 1:E 15) que es 29.0606 y =VARP(A1:E15), que es 844.52 para poblacio¬ 
nes. 
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Figura 4-2 Ventana de diálogo de MINITAB. 


En la ventana de diálogo de M INITAB, que se presenta en la figura 4-2, se han elegido las medidas de dispersión y de 
tendencia central. El resultado es el siguiente: 

Estadística descriptiva: e-mails 

Variable StDev Vari anee CoefVar Mínimum Q1 Q3 Máximum Range I QR 
e - ma i I s 2 9.2 6 8 5 5.9 3 4 4.5 6 2 4.0 0 4 0.0 0 8 6.0 0 1 2 5.0 0 1 0 1.0 0 4 6.0 0 


PROBLEMAS RESUELTOS 


EL RANGO 

4.1 Encontrar el rango de los conjuntos: a) 12, 6, 7, 3,15,10,18, 5 y b) 9, 3, 8, 8, 9, 8, 9,18. 

SOLUCIÓN 

En ambos casos, rango = número mayor - número menor = 18 - 3 = 15. Sin embargo, como se puede ver en las orde¬ 
naciones de los conjuntos a) y b), 

a) 3, 5, 6, 7,10,12,15,18 b) 3, 8, 8, 8, 9, 9, 9,18 

en el conjunto a) hay mucha más variación que en el conjunto b). En efecto, b ) consta casi únicamente de ochos y 
nueves. 

Dado que el rango no indica diferencia alguna entre estos conjuntos, en este caso no es una buena medida de disper¬ 
sión. Cuando hay valores extremos, el rango no suele ser una buena medida de la dispersión. 

Eliminando los valores extremos, 3 y 18, se logra una mejora. Entonces, el rango del conjunto a) es (15 - 5) = 10, 
en tanto que el rango del conjunto b) es (9 - 8) = 1, lo que muestra claramente que en a) hay mayor dispersión que en b). 
Sin embargo, el rango no ha sido definido de esta manera. El rango semiintercuartiI y el rango percentll 10-90 están con¬ 
cebidos para obtener una medida mejor que el rango mediante la eliminación de los valores extremos. 

4.2 Encontrar el rango de las estaturas de los estudiantes de la universidad X Y Z dadas en la tabla 2.1. 
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SOLUCIÓN 

Hay dos maneras para definir el rango de datos agrupados. 

Primer método 


Rango = marca de clase de la clase más alta - marca de clase de la clase más baja 
= 73 - 61 = 12 in 


Segundo método 


Rango = frontera superior de la clase más alta - frontera Inferior de la clase más baja 
= 74.5 - 59.5 = 15 in 

Empleando el primer método se tienden a eliminar, en cierta medida, los valores extremos. 


LA DESVIACIÓN MEDIA 


4.3 Encontrar la desviación media de los conjuntos de números del problema 4.1. 

SOLUCIÓN 

a) La media aritmética es 

-_12 + 6 + 7 + 3+15+10+18 + 5_76_ 

8 ~T~ 

La desviación media es 


DM 


N 

112 - 9.5| + |6 - 9.5| + |7 - 9.5| + |3 - 9.5| + |15 - 9.5| + 110 - 9.5| + 118 - 9.5| + |5 - 9.5| 

8 

2.5+ 3.5+ 2.5+ 6.5+ 5.5+ 0.5+ 8.5+ 4.5 34 „ 

8 8 


b) 


^_ 9 + 3 + 8 + 8 + 9 + 8 + 9+18 _72_^ 


DM 


E \x - x\ 

N 


|9 — 9| + |3 — 9| + |8 — 9| + |8 — 9| + |9 — 9| + |8 — 9| + |9 — 9| + |18 — 9| 

8 


_0+6+l+l+0+l+0+9_ 

- 8 - — : 

La desviación media indica, como debe ser, que en el conjunto b ) hay menos dispersión que en el conjunto a). 

4.4 Encontrar la desviación media de las estaturas de 100 estudiantes de la universidad X Y Z (ver tabla 3.2, proble¬ 
ma 3.20). 

SOLUCIÓN 

De acuerdo con el problema 3.20, X = 67.45 in. Para facilitar los cálculos, éstos pueden organizarse como en la tabla 4.1. 
También se puede idear un método de compilación para el cálculo de la desviación media (ver problema 4.47). 
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Tabla 4.1 


Estaturas (¡n) 

Marcas de clase (X ) 

\X-X\ = \X - 67.45| 

Frecuencia (f) 

f\X-X 1 

60-62 

61 

6.45 

5 

32.25 

63-65 

64 

3.45 

18 

62.10 

66-68 

67 

0.45 

42 

18.90 

69-71 

70 

2.55 

27 

68.85 

72-74 

73 

5.55 

8 

44.40 


0 

0 

II 

w 

II 

X; f\X - X\ = 226.50 


DM 


J 2 f\x-x\ 

N 


226.50 

100 


2.26 in 


4.5 Determinar el porcentaje de las estaturas de los estudiantes del problema 4.4 que cae dentro de los rangosa) 
Z±DM,b)X±2DM y c) X ± 3 DM . 

SOLUCIÓN 


a) El rango de 65.19 a 69.71 in es X ± DM = 67.45 ± 2.26. Este rango comprende a todos los individuos de la tercera 
clase + 5 ( 65.5 - 65.19) de los estudiantes de la segunda clase + 5 ( 69.71 - 68.5) de los estudiantes de la cuarta clase 
(ya que el tamaño del intervalo de clase es 3 in, la frontera superior de clase de la segunda clase es 65.5 in y la fron¬ 
tera Inferior de clase de la cuarta clase es 68.5 in). La cantidad de estudiantes en el rango X ± DM es 

42 + ^- (18) +^i (27) = 42+ 1.86+ 10.89 = 54.75 osea 55 
que es 55% del total. 

b) El rango de 62.93 a 71.97 in es X ± 2 DM = 67.45 ± 2(2.26) = 67.45 ± 4.52. El número de estudiantes en el rango 
X ± 2 D M es 


18- 


62.93 - 62.5 


(18) +42 + 27 + 


71.97-71.5 


(8) = 85.67 u 


86 


que es 86% del total. 

c) El rango de 60.67 a 74.23 in esX± 3 DM = 67.45 ± 3(2.26) = 67.45 ± 6.78. La cantidad de estudiantes en el rango 
X ± 3 D M es 


5- 


( 60.67 - s » ) (5) + , 8 + 42 + 27 + ( 74.5 - 74.23 ) {¡¡) ^ 


o sea 


97 


que es 97% del total. 


EL RANGO SEM 11NTERCUARTI L 

4.6 Encontrar el rango semüntercuartll en la distribución de las estaturas de los estudiantes de la universidad XYZ 
(ver tabla 4.1 del problema 4.4). 

SOLUCIÓN 

El cuartll inferior y el cuartll superior son Q x = 65.5 + ¿ (3) = 65.64 in y Q 3 = 68.5 + 12(3) = 69.61 in, respectivamen¬ 
te, y el rango semüntercuartll (o desviación cuartll) es Q = l(g 3 - Q x ) = 1(69.61 - 65.64) = 1.98 in. Obsérvese que el 
50% de los casos se encuentra entre Qj y 0 3 (es decir, la estatura de 50 estudiantes está entre 65.64 y 69.61 in). 
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Se puede considerar que i (Q 1 + Q 3 ) = 67.63 in es una medida de tendencia central (es decir, una altura promedio). 
Por lo tanto, 50% de las estaturas se encuentra entre 67.63 ± 1.98 in. 

4.7 Encontrar el rango semiintercuartil de los salarios de 65 empleados de la empresa P&R (ver la tabla 2.5 del 
problema 2.3). 

SOLUCIÓN 

De acuerdo con el problema 3.44, 0 x = $268.25 y0 3 = $290.75. Por lo tanto, el rango semiintercuartil es Q =$(Q 3 - Q 3 ) 
= ¿($290.75 - $268.25) = $11.25. Como ¿(Qj + 0 3 ) = $279.50, se puede concluir que 50% de los empleados tienen 
salarios que se encuentran en el rango de $279.50 ± $11.25. 


EL RANGO PERCENTIL 10-90 

4.8 Encontrar el rango percentiI 10-90 de las estaturas de los estudiantes de la universidad XYZ (ver tabla 2.1). 

SOLUCIÓN 

Aquí, P 10 = 62.5 + ^(3) = 63.33 ¡n y P go = 68.5 + §f(3) = 71.27 in. Por lo tanto, el rango percentll 10-90 es P 90 - P 10 
= 71.27 - 63.33 = 7.94 in. Como j(P 10 + P 90 ) = 67.30 in y ¿(P 90 - P 10 ) = 3.97 in, se puede concluir que las estaturas de 
80% de los estudiantes se encuentra en el rango de 67.30 ± 3.97 in. 


LA DESVIACIÓN ESTÁNDAR 

4.9 Encontrar la desviación estándar s de cada uno de los conjuntos de números del problema 4.1. 

SOLUCIÓN 

^ _ E ^ _ 12 + 6 + 7 + 3+15+10+18 + 5_76_ 

N 8 ~ 8 “ ' 

E {X-X) 2 
N 

/(12-9.5) 2 + (6-9.5) 2 + (7-9.5) 2 + (3-9.5) 2 + (15-9.5) 2 + (10-9.5) 2 + (18-9.5) 2 + (5-9.5) 2 

V 8 

= \/23.75 = 4.87 



b ) 


= 9 + 3 + 8 + 8 + 9 + 8 + 9+18 = 72 = 


E(^--E 

N 


(9 - 9) 2 + (3 - 9) 2 + (8 - 9) 2 + (8 - 9) 2 + (9 - 9) 2 + (8 - 9) 2 + (9 - 9) 2 + (18 - 9) 2 


= EÍ5 = 3.87 


Comparando los resultados anteriores con los del problema 4.3 se observa que la desviación estándar sí indica que 
el conjunto b) tiene menos dispersión que el conjunto a). Sin embargo, este efecto se enmascara por el hecho de que los 
valores extremos afectan a la desviación estándar mucho más que a la desviación media. Esto es de esperar, ya que para 
calcular la desviación estándar las desviaciones se elevan al cuadrado. 
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4.10 La desviación estándar délos dos conj untos de datos dados en el probl ema 4.1 pueden encontrarse con M INITA B. 
Adelántese presentan los resultados. Comparloscon los obtenidos en el problema 4.9. 

MTB > pr i nt c I 
set 1 

12 6 7 3 15 10 18 5 

MTB > pr i nt c2 
set 2 

9388 9 8 9 18 

MTB > standard d e v i a t i o n el 

Columna de desviación estándar 

Standard deviation of setl =5.21 
MTB>standard deviation c2 

Columna de desviación estándar 

Standard deviation of s e 12 = 4.14 


SOLUCIÓN 


MINITAB emplea la fórmula 


E(A--.V) 2 

N — 1 


y por lo tanto, en los problemas 4.9 y 4.10 no se obtiene la misma desviación estándar. Las respuestas del problema 4.10 
se pueden obtener de las del problema 4.9 multiplicando éstas por ^N/(N - 1). Como N = 8 para ambos conjuntos, 
tJn/(N - 1) = 1.069045. Entonces, para el conjunto 1 se tiene (1.069045)(4.87) = 5.21, que es la desviación estándar 
dada por M INITAB. De Igual manera, (1.069045)(3.87) = 4.14, que es la desviación estándar dada por M INITAB para 
el problema 2. 


4.11 Encuentre la desviación estándar de las estaturas de los 100 estudiantes de la universidad XYZ (ver tabla 
2 . 1 ). 

SOLUCIÓN 

De acuerdo con los problemas 3.15, 3.20 o bien 3.22, X = 67.45 ¡n. Los cálculos pueden organizarse como en la tabla 4.2. 


s = 


E /(A' - xy 

N 


852.7500 
100 


V8.5275 = 2.92 in 


Tabla 4.2 


Estaturas (¡n) 

M arcas de clase (X) 

X -X = X -61AS 

(X-X) 2 

Frecuencias ( f ) 

f(X - X) 2 

60-62 

61 

-6.45 

41.6025 

5 

208.0125 

63-65 

64 

-3.45 

11.9025 

18 

214.2450 

66-68 

67 

-0.45 

0.2025 

42 

8.5050 

69-71 

70 

2.55 

6.5025 

27 

175.5675 

72-74 

73 

5.55 

30.8025 

8 

246.4200 





o 

o 

II 

w 

II 

2; 

E f(x - X) 2 






= 852.7500 























Problemas resueltos 107 


CALCULO DE LAS DESVIACIONES ESTANDAR DE DATOS AGRUPADOS 
4.12 a) Demostrar que 


5 = 


£* 2 /£X\ 2 /= 


N 


N 


= V X 1 - X 2 


b) Usar la fórmula del Inciso a) para hallar la desviación estándar del conjunto 12, 6, 7, 3,15,10,18, 5. 
SOLUCIÓN 

a) Por definición 


Entonces 


Z(X-Xf 
N 

i2 £(X-Jf) 2 £(jr 2 -2JfX + Jf 2 ) J2X 2 -2XJ2X + NX 2 

s ~ Ñ ~ Ñ “ Ñ 

£ X 2 - £ X , £ X 2 - 2 £ X 2 - 2 

N N N N 


= x 2 -x 2 = 


12 x 2 ÍEj x2 

N V N 


o bien 


£ x 1 ÍJ 2 X 


N 


N 


= \ X 2 - X 2 


Obsérvese que en las sumatorias anteriores se ha usado la forma abreviada, empleando X en lugar deX, y £ en 


lugar de £jlj. 
Otro método 


s 2 = (X - X) 2 = X 2 - 2XX + X 2 = X 2 - 2XX + X 2 = X 2 - 2XX + X 2 = X 2 - X 2 

b ) £2 Ez2 í 12 ) 2 + ( 6 ) 2 + ( 7 ) 2 + ( 3 ) 2 + ( 15 ) 2 + ( 1Q ) 2 + ( 18 ) 2 + ( 5 ) 2 912 114 

TV 8 8 

- £X 12 + 6 + 7 + 3+15 + 10+18 + 5 76 

TV 8 8 “ ' 

Por lo tanto s = \¡Ñ^X 2 = = VÑÑTfS = 4.87 

Compárese este método con el del problema 4.9a). 

4.13 M odificar la fórmula del problema 4.12a) para introducir las frecuencias que corresponden a los diversos 
valores deX. 

SOLUCIÓN 

La modificación apropiada es 

Como en el problema 4.12a), a esta fórmula se puede llegar partiendo de 

J2f(X~X) 2 
N 
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E ntonces , 2 = E f{X ~ E /( ^ 2 - + ^ 2 ) _ E ^ - 2X y fX + y 2 y / 


N 


N 


N 

¿2 


y fx 2 _ v fx - 2 v /y 2 -2 - 2 y; /y 2 

■ 7 - - 2y ,, + y 2 = -2y- + y 2 = ^4 -y- 


y 


y 


y 


y 


E./E ó e./* 
y \ n 


o bien 


= / E fx 2 (HfxX 


y 


V y ) 


Obsérvese que la sumatoria anterior se ha usado en forma abreviada, empleando X y f en lugar deX ; - y f¡, y en lugar 

deELyEf=4i = «. 


4.14 Empleando la fórmula del problema 4.13, encontrar la desviación estándar délos datos de la tabla 4.2, proble¬ 
ma 4.11. 

SOLUCIÓN 

Los cálculos pueden organizarse como en la tabla 4.3, donde y = (E fX)/N = 67.45 in, según se obtuvo en el problema 
3.15. Observar que este método, como el del problema 4.11, conlleva cálculos muy tediosos. En el problema 4.17 se mues¬ 
tra cómo con el método de compilación se simplifican los cálculos enormemente. 


Tabla 4.3 


Estaturas (in) 

M arcas de clase (X ) 

X 2 

Frecuencias (f) 

fX 2 

60-62 

61 

3 721 

5 

18 605 

63-65 

64 

4 096 

18 

73 728 

66-68 

67 

4 489 

42 

188 538 

69-71 

70 

4 900 

27 

132 300 

72-74 

73 

5 329 

8 

42 632 


y = y / = 100 

EfX 2 = 455 803 


vEsr- (67 - 45 >’ - ^ - 292 ‘ 


4.15 Si d = X - A son las desviaciones deX respecto a una constante arbitraria A, probar que 


s = 


Efd 2 /E fd 


N 


■j\ 2 


N 


SOLUCION 

Como d = X - A,X =A + dyX = A + d (ver problema 3.18), entonces 

X - X = (A + d) - (A + d) = d - d 


de manera que 


y 


E/(y-y) _ Ef(d-d) 2 _ y fd 2 fj:/d 


y 


y v y 


de acuerdo con los resultados del problema 4.13 y sustituyendo X y y en lugar decf y d, respectivamente. 
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Otro método 


s 2 = {X - X) 2 = [d- df = d 2 - 2dd + d 2 

= S-2d 2 +d 2 =d¿-d 2 = YjY_ (YJYY 

N \ N J 

y la fórmula deseada se obtiene sacando la raíz cuadrada positiva. 

4.16 M ostrar que si en una distribución de frecuencia en la que todos los intervalos de clase son del mismo tamaño 
c, se compila cada marca de clase X con su valor correspondiente u de acuerdo con la relación X =A + cu, 
donde/1 es una marca de clase dada, entonces la desviación estándar se puede expresar como 


s = c\ 


E fu 2 ( E f u 


N 


N 


. , 1 -9 

= c y u A — ir 


SOLUCION 

Esto se deduce Inmediatamente del problema 4.15, ya que d = X - A = cu. Por lo tanto, como c es una constante, 


N 


V N J 


/ E f(cu) 2 í E ñcu) \ 2 l 2 E .fu 2 ¿ 7 E fu \ 2 /E .fu 2 f E fu 


N 


N 


N 


N 


Otro método 

Esta fórmula se puede probar también directamente sin usar el problema 4.15. Dado queX = A + cu, X = A + cu y 
x - x = c{u - ü), entonces 

s 2 = (X — X)~ = c 2 (u — ü) 2 = c 2 (u 2 — 2 uu + ü 2 ) = c 2 (u 2 — 2ü 2 + ü 2 ) = c 2 (u 2 — ü 2 ) 


y 


' = cV U 2 — U 2 = i 


E /« 2 ÍH fu 


N 


N 


4.17 Encontrar la desviación estándar de las estaturas de los estudiantes de la universidad XYZ (ver la tabla 2.1) 
empleando: a) la fórmula obtenida en el problema 4.15 y b) el método de codificación del problema 4.16. 

SOLUCIÓN 


En las tablas 4.4 y 4.5 arbitrariamente se ha elegido A igual a la marca de clase 67. Obsérvese que en la tabla 4.4 las des¬ 
viaciones cf =X -A son múltiplos del tamaño del intervalo de clase c = 3. En la tabla 4.5 se ha eliminado este factor. Esto 
da como resultado que en la tabla 4.5 los cálculos se simplifican enormemente (en comparación con los de los problemas 
4.11 y 4.14). Por esto se recomienda emplear el método de compilación siempre que sea posible, 
a) Ver la tabla 4.4. 


Tabla 4.4 


M arcas de clase (X) 

d = X -A 

Frecuencias (f) 

fd 

fd 2 

61 

-6 

5 

-30 

180 

64 

-3 

18 

-54 

162 

4 —> 67 

0 

42 

0 

0 

70 

3 

27 

81 

243 

73 

6 

8 

48 

288 


o 

o 

II 

w 

II 

Sí 

E«=45 

EfX 2 = 873 
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s = 




V8.5275 = 2.92 in 


b ) Ver la tabla 4.5 


Tabla 4.5 


M arcas de clase (X ) 

X - A 

u = - 

c 

Frecuencias (f) 

fu 

fu 2 

61 

-2 

5 

-10 

20 

64 

-2 

18 

-18 

18 

/4 —> 67 

0 

42 

0 

0 

70 

1 

27 

27 

27 

73 

2 

8 

18 

32 


TV = E / = 100 

E fu = 15 

E fu 2 = 97 


y = 




3^0.9475 =2.92 in 


4.18 Empleando el método de compilación, encontrar: a) la media y b) la desviación estándar de la distribución de 
los salarios délos 65 empleados de la empresa P&R (ver la tabla 2.5 del problema 2.3). 

SOLUCIÓN 

Los cálculos se pueden organizar como en la tabla 4.6. 

a) X = A + cü = A + c = $275.00 + ($10.00) ( ^ ) = $279.77 


b ) 


s = 


cVu~ - u 2 = 



($ 10 . 00 ) 



($10.00)-\/2.4341 


$15.60 


Tabla 4.6 


X 

u 

f 

fu 

fu 2 

$255.00 

-2 

8 

-16 

32 

265.00 

-1 

10 

-10 

10 

-> 275.00 

0 

16 

0 

0 

285.00 

1 

14 

14 

14 

295.00 

2 

10 

20 

40 

305.00 

3 

5 

15 

45 

315.00 

4 

2 

8 

32 


N =E f= 65 

E fu = 31 

E fu 2 = 173 


4.19 La tabla 4.7 muestra el Cl de 480 niños de primarla. Empleando el método de compilación, encontrar: a) la 
media y b) la desviación estándar. 
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Tabla 4.7 


M arca des clase (X) 

70 74 78 

82 

86 

90 

94 

98 

102 

106 

110 

114 

118 122 126 

Frecuencias (f) 

4 9 16 

28 

45 

66 

85 

72 

54 

38 

27 

18 

11 5 2 


SOLUCIÓN 

El cociente intelectual es 


d edad mental 
edad cronológica 

expresado como porcentaje. Por ejemplo, un niño de 8 años que (de acuerdo con ciertos procedimientos educativos) tiene una 
mentalidad de un niño de 10 años, tendrá un Cl de 10/8 = 1.25 = 125%, o simplemente 125, el signo % se sobreentiende. 

Para hallar la media y la desviación estándar de los cocientes intelectuales de la tabla 4.7, se pueden organizar los 
cálculos como en la tabla 4.8. 

a) X = A + cü = A + c = 94 + 4^ = 95.97 

N \480y 

W s-cV^=c,lzK. = 10.47 

Y N V N J V 480 V 480 / 

COM PROBACIÓN DECHARLIER 

4.20 Emplear la comprobación de Charlier para verificar los cálculos de: a) la media y b) la desviación estándar 
realizados en el problema 4.19. 

SOLUCIÓN 

Para hacer la comprobación deseada, a las columnas de la tabla 4.8 se agregan las columnas de la tabla 4.9 (con excepción 
de la columna 2, que por comodidad se repite en la tabla 4.9). 

a) De acuerdo con la tabla 4.9, f (u + 1) = 716; de acuerdo con la tabla 4.8, jTj fu + N = 236 + 480 = 716. Con esto 
se tiene la comprobación de la media. 


Tabla 4.8 
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Tabla 4.9 


u +1 

f 

f(u + 1) 

f(u + l) 2 

-5 

4 

-20 

100 

-4 

9 

-36 

144 

-3 

16 

-48 

144 

-2 

28 

-56 

112 

-1 

45 

-45 

45 

0 

66 

0 

0 

1 

85 

85 

85 

2 

72 

144 

288 

3 

54 

162 

486 

4 

38 

152 

608 

5 

27 

135 

675 

6 

18 

108 

648 

7 

11 

77 

539 

8 

5 

40 

320 

9 

2 

18 

162 


N = 52 f = 480 

E f (u + 1) = 716 

£ f(u + l) 2 = 4 356 


b ) De acuerdo con la tabla 4.9,52 f(u + l) 2 = 4 356; de acuerdo con la tabla 4.8,52 f 2 + 2 52 fu + N = 3 404 + 2(236) 
+ 480 = 4 356, con lo que se tiene la comprobación de la desviación estándar. 

CORRECCIÓN DE SHEPPARD PARA LA VARIANZA 

4.21 Empléela corrección deSheppard para determinar la desviación estándar de los datos en: a) el problema 4.17, 
b) el problema 4.18 y c) el problema 4.19. 

SOLUCIÓN 

a) s 2 = 8.5275 y c = 3. Varianza corregida = s 2 - c 2 /12 = 8.5275 - 3 2 /12 = 7.7775. Desviación estándar corregida 
= ^varianza corregida = V7.7775 = 2.79 in. 

b) s 2 = 243.41 y c = 10. Varianza corregida = s 2 - c 2 /12 = 243.41 - 10 2 /12 = 235.08. Desviación estándar corregida 
= ^2351)8 = $15.33. 

c) s 2 = 109.60 y c = 4. Varianza corregida = s 2 - c 2 /12 = 109.60 - 4 2 /12 = 108.27. Desviación estándar corregida 
= V108.27 = 10.41. 


4.22 Dada la segunda distribución de frecuencia del problema 2.8, encontrar: a) la media, b) la desviación estándar, 

c) la desviación estándar usando la corrección de Sheppard y d) la verdadera desviación estándar a partir de 
los datos no agrupados. 

SOLUCIÓN 

Los cálculos se pueden organizar como en la tabla 4.10. 

a) X = A + cü = A + = 149 + 9 ( = 147.01b 

N V 40 / 

w J = 9^32575- 13.71b 

c) Varianza corregida = s 2 - c 2 /12 = 188.27 - 9 2 /12 = 181.52. Desviación estándar corregida = 13.5 Ib. 
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Tabla 4.10 



d) Para calcular la desviación estándar a partir de los verdaderos pesos de los estudiantes, dados en el problema, convie¬ 
ne primero restarle a cada peso un número adecuado, por ejemplo, A = 150 Ib, y después usar el método del problema 
4.15. Las desviaciones d = X - A = X - 150 se dan en la tabla siguiente: 


-12 

14 

O 

-18 

-6 

-25 

-1 

7 

-4 

8 

-10 

-3 

-14 

-2 

2 

-6 

18 

-24 

-12 

26 

13 

-31 

4 

15 

-4 

23 

-8 

-3 

-15 

3 

-10 

-15 

11 

-5 

-15 

-8 

O 

6 

-5 

-22 


a partir de las cuales se encuentra quejad = -128 y Y, d 2 = 7 052. Entonces 

Por lo tanto, con la corrección de Sheppard, en este caso, se obtiene cierta mejora. 


RELACIONES EM PÍRICAS ENTRE LAS M EDI DAS DE DISPERSIÓN 

4.23 Dada la distribución de las estaturas de los estudiantes de la universidad XYZ, comentar la validez de las 
fórmulas empíricas: a) desviación media = ^(desviación estándar) y b) rango semiintercuartiI = f(desvíación 
estándar). 

SOLUCIÓN 

a) De acuerdo con los problemas 4.4 y 4.11, desviación media-r desviación estándar = 2.26/2.92 = 0.77, que es aproxi¬ 
madamente!. 

b ) De acuerdo con los problemas 4.6 y 4.11, rango semi i ntercuarti I desviación estándar = 1.98/2.92 = 0.68, que es 
aproximadamente j. 

Por lo tanto, en este caso las fórmulas empíricas son válidas. 

Obsérvese que no se usó la desviación estándar con corrección de Sheppard para agrupamiento, ya que no se hicie¬ 
ron las correcciones correspondientes a la desviación media ni al rango semi¡ntercuartílico. 

PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR 

4.24 En el problema 4.19 determinar el porcentaje de estudiantes cuyo Cl cae dentro de los rangos: a) X ± s, 
b) X ±2sy c) X ± 3s. 
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SOLUCIÓN 

a) El rango para los CI de 85.5 a 106.4 es X ± s = 95.97 ± 10.47. La cantidad de CI en el rango X ± s es 


’ 85 ' 5 ) (45) + 66 + 85 + 72 + 54 + ( 106,4 104 ) (38) = 339 


V 4 


El porcentaje de Cl en el rango X± s es 339/480 = 70.6%. 

b ) El rango de los Cl de 75.0 a 116.9 es X ± 2s = 95.97 ± 2(10.47). La cantidad de Cl en el rango X ± 2s es 


76 75 -°\ 9 ) + 16 + 28 + 45 + 66 + 85 + 72 + 54+ 38 + 27+ 18 + [ U6 '° 116 ) (11) = 451 


El porcentaje de Cl en el rango X ± 2s es 451/480 = 94.0%. 

c) El rango de los Cl de 64.6 a 127.4 es X ± 3s = 95.97 ± 3(10.47). La cantidad de Cl en el rango X ± 3s es 


i oq_ 197 4 N 

480-( -^—1(2) = 479.7 O 480 


El porcentaje de Cl en el rango X ± 3s es 479.7/480 = 100%. 

Los porcentajes de los incisos a), b) y c) coinciden con los esperados en una distribución normal: 68.27%, 95.45% 
y 99.73%, respectivamente. 

Obsérvese que no se ha usado la corrección de Sheppard para la desviación estándar. Si se usa esta corrección, los 
resultados, en este caso, coinciden estrechamente con los anteriores. Obsérvese que los resultados anteriores también pue¬ 
den obtenerse usando la tabla 4.11 del problema 4.32. 


4.25 Dados los conjuntos 2, 5, 8, 11, 14 y 2, 8, 14, encontrar: a) la media de cada conjunto, b) la varianza de cada 
conjunto, c) la media délos conjuntos combinados (o conjuntados) y d) la varianza de los conjuntos combina¬ 
dos. 

SOLUCIÓN 

a) M edia del primer conjunto = 4 (2 + 5 + 8 + 11 + 14) = 8. M edia del segundo conjunto = i(2 + 8 + 14) = 8. 

b) Varianza del primer conjunto = sf = 4 [(2 - 8) 2 + (5 - 8) 2 + (8 - 8) 2 + (11 - 8) 2 + (14 - 8) 2 ] = 18. Varianza del 
segundo conjunto = s¡ = | [(2 - 8) 2 + (8 - 8) 2 + (14 - 8) 2 ] = 24. 

c) La media de los conjuntos combinados es 

2 + 5 + 8+11 + 14 + 2 + 8 + 14 „ 


cf) La varianza de los conjuntos combinados es 

2 _ (2 - 8) 2 + (5 - 8) 2 + (8 - 8) 2 + (11 - 8) 2 + (14 - 8) 2 + (2 - 8) 2 + (8 - 8) 2 + (14 - 8) 2 


Otro método (mediante fórmula) 


2 N | .y 2 + N 2 S 2 


(5) (18) + (3) (24) 


20.25 


N\ + N 2 


5 + 3 
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4.26 Resolver el problema 4.25 con los conjuntos 2, 5, 8,11,14 y 10,16, 22. 

SOLUCIÓN 

Aquí las medias de los dos conjuntos son 8 y 16, respectivamente, en tanto que las varianzas son las mismas que las vari an- 
zas en el problema anterior, a saber: sf = 18 y s\ = 24. 

...... . , 2 + 5 + 8+11 + 14 + 10+16 + 22 

M edia de los conjuntos combinados =- —-z -= 11 


2 _ (2 — 11) 2 + (5 — 11) 2 + ( 8 - 11) 2 + (11 — 11) 2 + (14 — 11) 2 + (10 — 11) 2 + (16 — 11) 2 + (22 — 11) 2 


Obsérvese que la fórmula 

^2 _ 2Vi .T 2 + N 2 s\ 

S N r +N 2 

con la que se obtiene el valor 20.25, no es aplicable en este caso, ya que las medias de los dos conjuntos no son ¡guales. 

4.27 a) Probar que 1 / 1/ 2 + pw + q, donde p y q son constantes dadas, es mínimo si y sólo si 1 / 1 / = -jp. 
b) Empleando el Inciso a), probar que 

———- o brevemente 

N 


T(X-a ) 2 

N 


es mínimo si y sólo si a = X. 


SOLUCIÓN 

a) Se tiene w 2 +pw + q = ( w + \pf + q-\p 2 . Como (q -\p 2 ) es constante, esta expresión tiene su mínimo valor si 
y sólo si w + 3 P = 0 (es decir, w = -jp). 

b) J2(X-a) 2 _ J2(X 2 -2aX +a 2 ) _ J2X 2 -2a J2X +Na 2 _ 2 _ £* E^ 2 

N N N C> a N N 

Comparando esta última expresión con (w 2 + pw + q ), se tiene 


w = a 

Por lo tanto, la expresión tiene un mínimo en a 


P = - 2 


-\p = 


N 


q = 


T.x 2 

N 


iY. x )/ N = x ' empleando el resultado del inciso a). 


DISPERSIÓN ABSOLUTA Y RELATIVA; COEFICIENTE DE VARIACIÓN 

4.28 Un fabricante de cinescopios produce dos tipos de cinescopios, A y B. La vida media de los cinescopios es, 
respectivamente, X A = 1 495 horas yí B = l 875 horas, y las desviaciones estándar son = 280 horas y 
s B = 310 horas. ¿Cuál de los cinescopios tiene: a) la mayor dispersión absoluta y b) la mayor dispersión rela¬ 
tiva? 
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SOLUCIÓN 


a) La dispersión absoluta deÁ es s A = 280 horas y la de 6 es s B = 310 horas. Por lo tanto, en los cinescopios 6 hay 
mayor dispersión absoluta. 

b ) Los coeficientes de variación son 


280 
~ 1~495 


18 . 7 % 


S B _ 310 
X~ B ~ 1 875 


16 . 5 % 


Por lo tanto, los cinescopios A tienen mayor variación relativa o dispersión. 


4.29 Encontrar el coeficiente de vari ación, V, délos datos: a) del problema 4.14 y b) del problema 4.18, empleando 
la desviación estándar corregida y la desviación estándar no corregida. 


SOLUCION 

a) 


b ) 


,,, . Sino corregida) 2.92 

V (no corregida) =-—-= — ^ = 0.0433 = 4 . 3 % 


V (corregida) = s - cor ^SÍ ( fa ) _ = 0.0413 = 4 . 1 % de acuerdo con el problema 4 . 21 a ) 

V (no corregida) = S ( noco ^g lda ) = = 0 . 196 = 19 . 6 % 

i & > x 79.77 

V (corregida) = s ( corl ^g^ da ) _ — 0.192 = 19 . 2 % de acuerdo con el problema 4 . 21 Ó ) 


4.30 a) Definir una medida de dispersión relativa que pueda emplearse para un conjunto de datos en el que se 
conocen los cuartlles. 

b) Ilustrar el cálculo de la medida definida en el Inciso a) aplicándolo a los datos del problema 4.6. 


SOLUCIÓN 


a) Si para un conjunto de datos, sedan los cuarti les C? x y 0 3 entonces + g 3 ) es una medida de tendencia central de 
los datos o promedio, en tanto que Q = HQí ~ 6i), el rango semiintercuartil, es una medida de dispersión de los 
datos. De manera que una medida de dispersión relativa se puede definir de la siguiente manera. 

j(g 3 ~ gi) g 3 -gi 
0 j (21 + 03 ) 63 + 61 

a la que se le llama coeficiente de variación cuartil o coeficiente cuartil de dispersión relativa. 


b) 


V Q = 


6 3 — 61 
63 + 61 


69.61 - 65.64 
69.61 + 65.64 


3.97 

135.25 


= 0.0293 = 2 . 9 % 


VARIABLES ESTANDARIZADAS; PUNTUACIONES ESTÁNDAR 


4.31 En el examen final de matemáticas en el que la media es 76 y la desviación estándar es 10, un alumno obtiene 
una calificación de 84. En el examen final de física, en el que la media es 82 y la desviación estándar es 16, el 
mismo alumno obtiene como puntuación 90. ¿En qué materia tiene una posición relativa más alta? 

SOLUCIÓN 

L a variable estandarizada z= (X - X)/s mide la desviación deX respecto a la media X en término de desviaciones están¬ 
dar s. En matemáticas, z = (84 - 76)/10 = 0.8, y en física z = (90 - 82)/16 = 0.5. Por lo tanto, la calificación de este 
estudiante en matemáticas se encuentra a 0.8 de una desviación estándar sobre la media, en cambio la puntuación en física 
se encuentra a sólo 0.5 de una desviación estándar sobre la media. Por lo tanto, en matemáticas obtuvo una posición rela¬ 
tiva más alta. 

La variable z = (X - X)/s suele emplearse para las calificaciones de los exámenes de conocimientos, en donde se 
denomina calificación estándar. 
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SOFTWARE Y MEDIDAS DE DISPERSIÓN 

4.32 El análisis hecho con STATISTIX de los datos del ejemplo 3 de este capítulo da los resultados siguientes: 

Statistix 8.0 

Descriptive Statistics 

Variable SD Variance C.V. MAD 

e - mails 29.256 855.93 44.562 21.000 

El valor M AD es la desviación mediana absoluta. Se trata del valor mediano de las diferencias absolutas entre 
cada uno délos valores y la mediana muestral. Verificar que el valor MAD de estos datos es 21. 

SOLUCIÓN 


L os datos ordenados de menor a mayor son: 


24 

24 

24 

25 

26 

28 

29 

30 

31 

31 

31 

32 

32 

35 

35 

36 

39 

40 

40 

42 

42 

44 

44 

45 

47 

49 

51 

52 

54 

54 

54 

57 

58 

58 

58 

60 

61 

61 

63 

65 

65 

68 

69 

70 

71 

71 

74 

74 

74 

77 

77 

77 

77 

79 

80 

84 

86 

86 

95 

95 

99 

99 

100 

102 

102 

105 

113 

113 

114 

115 

116 

118 

121 

122 

125 





La mediana de los datos originales es 61. 
Si a cada dato se le resta 61, se obtiene: 


-37 

-37 

-37 


-36 

-35 

-33 

-32 

-31 

-30 

-30 

-30 

-29 

-29 


-26 

-26 

-25 


-22 

-21 

-21 

-19 

-19 

-17 

-17 

-16 

-14 

-12 


-10 

-9 

-7 


-7 

-7 

-4 

-3 

-3 

-3 

-1 

0 

0 

2 


4 

4 

7 


8 

9 

10 

10 

13 

13 

13 

16 

16 

16 


16 

18 

19 


23 

25 

25 

34 

34 

38 

38 

39 

41 

41 


44 

52 

52 


53 

54 

55 

57 

60 

61 

64 





A hora se toma el valor absoluto de estos datos: 









37 

37 

37 

36 

35 

i 33 

32 

31 

30 

30 

30 

29 

29 

26 

26 

25 

22 

21 

21 

19 19 

17 

17 

16 

14 

12 

10 

9 

7 

7 

7 

4 

3 

3 

2 

i 1 

0 

0 

2 

4 

4 

7 

8 

9 

10 

10 

13 

13 

13 

16 16 

16 

16 

18 

19 

23 

25 

25 

34 

34 

38 

38 

39 

41 

41 

44 

52 

52 

53 

54 

55 

57 

60 

61 

64 


La mediana de este último conjunto es 21. Por lo tanto, M AD = 21. 
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PROBLEMAS SUPLEMENTARIOS 

RANGO 

4.33 Encontrar el rango de los conjuntos: a) 5, 3, 8, 4, 7, 6,12, 4, 3 y b) 8.772, 6.453,10.624, 8.628, 9.434, 6.351. 

4.34 Encontrar el rango de las cargas máximas dadas en la tabla 3.8 del problema 3.59. 

4.35 Encontrar el rango de los diámetros de remaches dados en la tabla 3.10 del problema 3.61. 

4.36 En 50 medidas, la mayor es de 8.34 kilogramos (kg). SI el rango es 0.46 kg, encontrar la medida menor. 

4.37 En la tabla siguiente se dan las semanas que necesitaron 25 trabajadores, que perdieron su trabajo por reducción de perso¬ 
nal en sus empresas, para encontrar un nuevo empleo. Encontrar el rango de estos datos. 


13 

13 

17 

7 

22 

22 

26 

17 

13 

14 

16 

7 

6 

18 

20 

10 

17 

11 

10 

15 

16 

8 

16 

21 

11 


DESVIACIÓN MEDIA 

4.38 Encontrar el valor absoluto de: a) -18.2, b) +3.58, c) 6.21, d) 0, e) -\/2 y f) 4.00 - 2.36 - 3.52. 

4.39 Encontrar la desviación media de los conjuntos: a) 3, 7, 9, 5 y b) 2.4,1.6, 3.8, 4.1, 3.4. 

4.40 Encontrar a desviación media de los conjuntos de números del problema 4.33. 

4.41 Encontrar la desviación media de las cargas máximas dadas en la tabla 3.8 del problema 3.59. 

4.42 a) Encontrar la desviación media (DM ) de los diámetros de los remaches de la tabla 3.10 del problema 3.61. 

b ) ¿Qué porcentaje de los diámetros de los remaches está entre (X ± DM), (X ± 2 DM ) y (X = 3 DM)? 

4.43 En el conjunto 8,10,9,12,4,8,2, encontrar la desviación media: a) respecto a la media y ó) respecto a la mediana. Verificar 
que la desviación media respecto a la mediana no es mayor que la desviación media respecto a la media. 

4.44 En la distribución dada en la tabla 3.9 del problema 3.60, encontrar la desviación media: a) respecto a la media y ó) respec¬ 
to a la mediana. Emplear los resultados de los problemas 3.60 y 3.70. 

4.45 En la distribución dada en la tabla 3.11 del problema 3.62, encontrar la desviación media: a) respecto a la media y b) res¬ 
pecto a la mediana. Emplear los resultados de los problemas 3.62 y 3.72. 
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4.46 Encontrar la desviación media de los datos dados en el problema 4.37. 

4.47 Deducir fórmulas de compilación para el cálculo de la desviación media: a) respecto a la media y b ) respecto a la mediana 
a partir de una distribución de frecuencias. E mplear estas fórmulas para verificar los resultados obtenidos en los problemas 
4.44 y 4.45. 


EL RANGO SEM IINTERCUARTIL 

4.48 Encontrar el rango semiintercuartiI en las distribuciones: a) del problema 3.59, b ) del problema 3.60 y c) del problema 
3.107. En cada caso interpretar los resultados claramente. 

4.49 Encontrar el rango semi i ntercuarti I de los datos dados en el problema 4.37. 

4.50 Probar que en cualquier distribución defrecuenci as, el porcentaje de casos que cae en el Intervalo í(Q l + g 3 ) ±j(g 3 - Q\) 
es el 50%. ¿Ocurre lo mismo en el Intervalo Q 2 ± 3(63 - Q\)l Explicar la respuesta. 

4.51 a) ¿Cómo se graficaría el rango semi ¡ntercuarti I correspondiente a una distribución de frecuencias dada? 
b ) ¿Qué relación hay entre el rango semi i ntercuarti I y la ojiva de una distribución? 

EL RANGO PERCENTIL 10-90 

4.52 Encontrar el rango percentil 10-90 en las distribuciones: a) del problema 3.59 y b) del problema 3.107. En cada caso Inter¬ 
pretar los resultados claramente. 

4.53 El décimo percentil de los precios de venta de las casas en determinada ciudad es $35 500 y el nonagésimo percentil de los 
precios de venta de las casas en la misma ciudad es $225 000. E ncontrar el rango percentil 10-90 y dar un rango en el que 
caiga el 80% de los precios de venta. 

4.54 ¿Qué ventajas o desventajas tiene un rango percentil 20-80 en comparación con un rango percentil 10-90? 

4.55 Contestar el problema 4.51 en relación: a) con el rango percentil 10-90, b) con el rango percentil 20-80 y c) el rango per- 
centll 25-75. ¿Cuál es la relación entre c) y el rango semi¡ntercuartiI? 


LA DESVIACIÓN ESTÁNDAR 

4.56 Encontrar la desviación estándar de los conjuntos: a) 3, 6, 2,1, 7, 5; b) 3.2, 4.6, 2.8, 5.2, 4.4, y c) 0, 0, 0, 0, 0,1,1,1. 

4.57 a) Sumando 5 a cada uno de los números del conjunto 3, 6, 2,1, 7, 5 se obtiene el conjunto 8,11, 7, 6,12,10. M ostrar 

que los dos conjuntos tienen la misma desviación estándar pero diferentes medias. ¿Qué relación hay entre las 
medias? 

b ) Si cada uno de los números del conjunto 3, 6, 2, 1, 7 y 5 se multiplica por 2 y después se le suma 5, se obtiene el 
conjunto 11,17, 9, 7,19,15. ¿Qué relación existe entre las medias y las desviaciones estándar de estos dos conjun¬ 
tos? 

c) ¿Qué propiedades de la media y de la desviación estándar se ilustran mediante los conjuntos de números particulares 
de los incisos a) y b )? 
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4.58 Encontrar la desviación estándar del conjunto de números de la progresión aritmética 4,10,16, 22,..., 154. 

4.59 Encontrar la desviación estándar en las distribuciones: a) del problema 3.59, b) del problema 3.60 y c) del problema 

3.107, 

4.60 Ilustrar el uso de la comprobación de Charlier en cada inciso del problema 4.59. 

4.61 Encontrar: a) la media y b) la desviación estándar en la distribución del problema 2.17 y explicar el significado de los 

resultados obtenidos. 

4.62 Cuando los datos tienen una distribución en forma de campana, la desviación estándar se puede obtener de manera aproxi¬ 
mada dividiendo el rango entre 4. Con los datos dados en el problema 4.37, calcular la desviación estándar y compararla 
con el rango dividido entre 4. 

4.63 a) Encontrar la desviación estándar s de los diámetros de los remaches dados en la tabla 3.10 del problema 3.61. 

b) ¿Qué porcentaje de los diámetros de los remaches se encuentra entre X ± s, X ± 2s y X ± 3.v? 

c) Comparar los porcentajes del inciso b ) con los que teóricamente se esperan en una distribución normal y explicar 

cualquier diferencia observada. 

4.64 Aplicar la corrección de Sheppard a las desviaciones estándar del problema 4.59. En cada caso, comentar si la aplicación 
de la corrección de Sheppard está o no justificada. 

4.65 ¿Qué modificaciones ocurren en el problema 4.63 cuando se aplica la corrección de Sheppard? 

4.66 a) Encontrar la media y la desviación estándar de los datos del problema 2.8. 

b ) Construir una distribución de frecuencia para los datos y encontrar la desviación estándar. 

c) Comparar los resultados del inciso b ) con los del inciso a). Determinar si la aplicación de la corrección de Sheppard 
produce mejores resultados. 

4.67 Repetir el problema 4.66 con los datos del problema 2.27. 

4.68 a) De un total de N números, la fracción p es de unos y la fracción q = 1 - p es de ceros. Probar que la desviación están¬ 

dar de este conjunto de números es ^pq. 
b) Aplicar el resultado del inciso a) al problema 4.56c). 

4.69 a) Probar que la varianza del conjunto de números a, a + d, a + 2d,..., a + (n - l)d (es decir, de una progresión arit¬ 

mética en la que el primer término es a y la diferencia común es d) es -¡^(n 2 - l)d 2 . 
b) Emplear el inciso a) para el problema 4.58. [ Sugerencia: Usar 1 + 2 + 3 + (n - 1) = ¡n(n - 1), 1 2 + 2 2 + 3 2 +■■■ 

+(n-l) 2 = ¿n(n-l)(2n-l)j. 

4.70 Generalizar y probar la propiedad 3 de este capítulo. 

RELACIONES EMPÍRICAS ENTRE LAS M EDIDAS DE DISPERSIÓN 

4.71 Comparando las desviaciones estándar obtenidas en el problema 4.59 con las desviaciones medias correspondientes de los 
problemas 4.41, 4.42 y 4.44, determinar si se cumple la siguiente relación empírica: desviación media = ^(desviación 
estándar). Explicar cualquier diferencia que se presente. 
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4.72 Comparando las desviaciones estándar obtenidas en el problema 4.59 con los correspondientes rangos semiintercuartiles 
del problema 4.48, determinar si se cumple la siguiente relación empírica: rango semiintercuartil = §(desviación estándar). 
Explicar cualquier diferencia que se presente. 


4.73 ¿Qué relación empírica se espera que exista entre el rango semiintercuartil y la desviación media en distribuciones en forma 
de campana ligeramente sesgadas? 


4.74 U na distribución de frecuencias que es aproximadamente normal tiene un rango semiintercuartil igual a 10. ¿Qué valor se 
espera que tenga: a) la desviación estándar y b) la desviación media? 


DISPERSIÓN ABSOLUTA Y RELATIVA; COEFICIENTE DE VARIACIÓN 

4.75 En un examen final de estadística, la calificación media en un grupo de 150 alumnos es 78 y la desviación estándar 8.0. En 
álgebra, la puntuación media final del grupo es 73 y la desviación estándar 7.6. ¿En qué materia hay: a) mayor dispersión 
absoluta y b ) mayor dispersión relativa? 


4.76 Encontrar el coeficiente de variación de los datos: a) del problema 3.59 y bj del problema 3.107. 


4.77 En las calificaciones obtenidas por los estudiantes en un examen de admisión, el primer cuartil es 825 y el segundo cuartil 
es 1125. Calcular el coeficiente cuartil de variación en estas calificaciones del examen da admisión. 


4.78 En el grupo de edad de 15 a 24 años, el primer cuartil de ingreso familiar es $16 500 y el tercer cuartil de ingreso fami¬ 
liar, en este mismo grupo de edad, es $25 000. Calcular el coeficiente cuartil de variación de la distribución de 
los ingresos en este grupo de edad. 

VARIABLES ESTANDARIZADAS; PUNTUACIONES ESTÁNDAR 

4.79 En el examen del problema 4.75 la calificación de un estudiante en estadística es 75 y en álgebra 71. ¿En qué examen tiene 
una puntuación relativa más alta? 


4.80 Convertir el conjunto 6, 2, 8, 7, 5 en puntuaciones estándar. 


4.81 Probar que la media y la desviación estándar en un conjunto de puntuaciones estándar son iguales a 0 y 1, respectivamente. 
Emplear el problema 4.80 para ilustrar esto. 

4.82 a) Convertir las calificaciones del problema 3.107 en puntuaciones estándar y b) construir una gráfica defrecuencias rela¬ 
tivas contra puntuaciones estándar. 


SOFTWARE Y MEDIDAS DE DISPERSIÓN 


4.83 En la tabla 4.11 se da el ingreso per cápita en los 50 estados de Estados U nidos, en 2005. 


122 Capítulo 4 Desviación estándar y otras medidas de dispersión 


Tabla 4.11 I ngreso per cápita en los 50 estados de E stados U nidos 


Estado 

Ingreso per cápita 

Estado 

Ingreso per cápita 

Wyoming 

36 778 

Pennsylvania 

34 897 

Montana 

29 387 

Wisconsin 

33 565 

North Dakota 

31 395 

Massachusetts 

44 289 

New México 

27 664 

Missouri 

31 899 

West Virginia 

27 215 

Idaho 

28 158 

Rhode Island 

36 153 

Kentucky 

28 513 

Virginia 

38 390 

Minnesota 

37 373 

South Dakota 

31 614 

Florida 

33 219 

Alabama 

29 136 

South Carolina 

28 352 

Arkansas 

26 874 

New York 

40 507 

Maryland 

41 760 

Indiana 

31 276 

Iowa 

32 315 

Connecticut 

47 819 

Nebraska 

33 616 

Ohio 

32 478 

Hawaii 

34 539 

New Hampshire 

38 408 

Mississippi 

25 318 

Texas 

32 462 

Vermont 

33 327 

Oregon 

32 103 

Maine 

31 252 

New Jersey 

43 771 

Oklahoma 

29 330 

California 

37 036 

Delaware 

37 065 

Colorado 

37 946 

Alaska 

35 612 

North Carolina 

30 553 

Tennessee 

31 107 

Illinois 

36 120 

Kansas 

32 836 

Michigan 

33 116 

Arizona 

30 267 

Washington 

35 409 

Nevada 

35 883 

Georgia 

31 121 

Utah 

28 061 

Louisiana 

24 820 


El análisis de estos datos obtenido con SPSS es el siguiente: 

E stadística descriptiva 



N 

Rango 

Desviación estándar 

Varianza 

Ingresos 

50 

22 999.00 

4 893.54160 

2E+007 

N validado 

50 





Verificar el rango, la desviación estándar y la varianza. 













M OMENTOS, 
SESGO Y 
CURTOSIS 



MOMENTOS 


Dados N valores X 1; X 2 ,...,X N que toma la vari able X, se define la cantidad 


- t = X[ + X I 2 


r N U E* r 


N 


N 


N 


a la que se le llama el r-ésimo momento. El primer momento, en el quer = 1 es la media aritmética X. 
El r-ésimo momento respecto a la media X se define como 


N 




m ,. = 


j= i 


N 


E {x-xy 

N 


= (x-xy 


SI r = 1, entonces m 1 = 0 (ver el problema 3.16). SI r = 2, entonces m 2 es la varlanza. 
El r-ésimo momento respecto a cualquier origen A se define de la manera siguiente 


E - A y 

U E {X-A) r E d r 


N 


N 


N 


= (X-A) r 


( 1 ) 


( 2 ) 


(3) 


donde lascí = X - A son las desviaciones de lasX respecto de/1. SI A = 0, la ecuación (3) se reduce a la ecuación (1). 
Debido a esto, a la ecuación (1) suele llamársele el r-ésimo momento respecto de cero. 


MOM ENTOS PARA DATOS AGRUPADOS 

SI X 1; X 2 ,...,X K se presentan con frecuencias f 1; f 2 ,..., f K , respectivamente, los momentos anteriores están dados por 

Y? _ f\X\ + fiXj + • • • +ÍkXk __ /=' _ E fá 

N N ~ N [ ' 
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K 


J2fÁ X J~X) 



N 


( 5 ) 


K 


T,fÁ x J- A ) 



N 


donde N = X* i fj = X/- Estas fórmulas se emplean para el cálculo de momentos de datos agrupados. 

RELACIONES ENTRE MOMENTOS 

Entre los momentos respecto a la media m r y los momentos respecto de un origen arbitrarlo m' r existen las relaciones 
siguientes: 


m 2 = m 2 — m'\ 

m 2 = w 3 — 3m[m 2 + 2mp 

m A = m 4 — Ain ( m( + 6m( 2 m 2 — 3 m[ 4 


(7) 


etcétera (ver problema 5.5). Obsérvese que m( = X - A. 

CÁLCULO DE MOMENTOSPARA DATOSAGRUPADOS 

El método de compilación dado en capítulos anteriores para el cálculo déla media y de la desviación estándar también 
puede usarse para obtener un método abreviado para el cálculo de los momentos. Este método aprovecha el hecho de 
qu eX¡=A + cu¡ (o brevemente, X =A + cu), de manera que de acuerdo con la ecuación (6) se tiene 



( 8 ) 


m, = c 


que puede usarse para hallar m r empleando las ecuaciones (7). 

COMPROBACIÓN DE CHARLIER Y CORRECCIÓN DE SHEPPARD 

La comprobación de Charlier al calcular momentos mediante el método de compilación emplea las Identidades: 


X f( u + 1) = X / M + ^ 

X /( M + l) 2 = X f u ' + 2 X f u + N 
X/(«+ 1 ) 3 = X / y3 + 3 X / y2 + 8 X f u + 77 
X/( H +1) = X + 4X/w 3 + 6 X fu 2 + 4 X/ w +N 


(9) 


Las correcciones de Sheppard para momentos son las siguientes: 

m 2 corregido = m 2 - ^c 2 m 4 corregido = m 4 -\c 2 m 2 c 4 
Los momentos m 1 y m 3 no necesitan corrección. 


MOMENTOSEN FORMA ADIM EN SI O NAL 


Para evitar usar unidades particulares, se definen momentos adimensionales respecto de la media: 


m r m r m r 


a r = — = —==— =- 

s (V™2) r 

donde.? = v fñü es la desviación estándar. Como m 1 = 0y m 2 = s 2 , se tiene a 3 = 0 y a 2 = 1. 



( 10 ) 
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SESGO 


El sesgo de una distribución es su grado de asimetría o el grado en el que se aleja de la simetría. SI una curva de fre¬ 
cuencias (polígono de frecuencias suavizado) de una distribución tiene una cola más larga hacia la derecha del máximo 
central que hacia la izquierda, se dice que la distribución es sesgada a la derecha, o que tiene un sesgo positivo. Si 
ocurre lo contrario, se dice que es sesgada a la izquierda o que tiene un sesgo negativo. 

En las distribuciones sesgadas, la media tiende a encontrarse del mismo lado que la cola más larga opuesto al déla 
moda y que la cola más larga (ver figuras 3-1 y 3-2). Por lo tanto, una medida de la simetría (o sesgo) se obtiene 
mediante la diferencia: media - moda. Esta medida se puede hacer adimensional dividiendo entre una medida de dis¬ 
persión, como la desviación estándar, lo que conduce a la definición: 

g media —moda X — moda 

desviación estándar S 

Para evitar el uso de la moda se puede utilizar la fórmula empírica (10) del capítulo 3 y definir 

S 3 (media — mediana) 3(X — mediana) 

desviación estándar S 


A las ecuaciones (11) y (12) se les llama, respectivamente, primer coeficiente de sesgo de Pearson y segundo coefi¬ 
ciente de sesgo de P earson. 

Otras medidas del sesgo, que se definen en términos decuartilesy percentiles, son las siguientes: 


Coeficiente cuartil de sesgo 


(0 3 -0 2 )-(02-0i) 

0 3 ~ 0 1 


0 3 — 2Q 2 + 0 1 

Os - 01 


(13) 


n f ■ t A , n nn 90 — P 50) “ (P 50 — P lo) P 90 — 2 P 50 + P 10 n A\ 

Coeficiente de sesgo percentil 10-90 =-----=----- (14) 

“ 90 — P 10 “ 9o — r' io 

En una importante medida del sesgo se emplea el tercer momento respecto de la media, tal medida expresada en 
forma adimensional viene dada por: 


» 7 3 «; 3 m 3 

Coeficiente momento de sesgo = a 3 = = ——— = —= 

s b {y/m 2 )3 


(15) 


Otra medida de sesgo suele darse medi ante b x = aj. En las curvas perfectamente si métricas, por ejemplo en la curva 
normal, a 3 y b 1 son cero. 


CURTOSIS 


La curtosis indica qué tan puntiaguda es una distribución; esto porlo regulares en relación con la distribución normal. 
A una distribución que tiene un pico relativamente alto se le llama leptocúrtica, en tanto que si es relativamente aplas¬ 
tada se dice platicúrtica. Una distribución normal, que no es ni puntiaguda ni muy aplastada se llama mesocúrtica. 

En una medida de la curtosis se emplea el cuarto momento respecto déla media, expresada en forma adimensional, 
esta medida se encuentra dada por: 


_ _ . , . m 4 m 4 .... 

Coeficiente momento de curtosis = a 4 = —¡- = ^r (lo) 

s 4 

el cual suele denotarse b 2 . En las distribuciones normales b 2 = a 4 = 3. A esto se debe que la curtosis suela definirse 
mediante (b 2 - 3), que tiene signo positivo en una distribución leptocúrtica, negativo en una distribución platicúrtica 
y cero en las distribuciones normales. 

Otra medida de la curtosis se basa tanto en los cuartiles como en los percentiles y está dada por 


K = 



(17) 


dondeO =7(0 3 —Oí) es el rango semiintercuartil. A n (letra griega minúscula kappa) se le conoce como coeficiente 
percentil de curtosis; en las distribuciones normales, el valor de k es 0.263. 
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MOMENTOS, SESGO Y CURTOSIS POBLACIONALES 

Cuando es necesario distinguir los momentos muéstrales, las medidas de sesgo muéstrales o las medidas de curtosis 
muéstrales, de las correspondientes medidas de la población de la que es parte la muestra, se acostumbra usar letras 
del alfabeto latino para las primeras y letras del alfabeto griego para las últimas. Así, si los momentos muéstrales se 
denotan m r y m' r , los correspondientes momentos poblacionales serán, /x r y ¡i' r (/x es la letra mu del alfabeto griego). 
Como subíndices se emplean siempre letras del alfabeto latino. 

De Igual manera, si las medidas muéstrales de sesgo y curtosis se denotan a 3 y a 4 , respectivamente, los sesgos y 
las curtosis poblacionales serán a 3 y a A (a es la letra alfa del alfabeto griego). 

Como ya se dijo en el capítulo 4, la desviación estándar de una muestra y la desviación estándar de una población 
se denotan s y a, respectivamente. 

CÁLCULO DEL SESGO Y DE LA CURTOSIS 
EMPLEANDO SOFTWARE 

El software visto en este libro puede usarse para calcular las medidas de curtosis y de sesgo de datos muéstrales. Los 
datos que se presentan en la tabla 5.1 son muestras de 50 elementos (de tamaño 50) tomadas de distribuciones, una 
normal, otra sesgada a la derecha, otra sesgada a la Izquierda y la última es una distribución uniforme. 

L os datos normales son estaturas de mujeres, los datos sesgados a la derecha son edades de casamiento de mujeres, 
los datos sesgados a la Izquierda son edades a las que fallecen las mujeres, y los datos uniformes son cantidades de 


Tabla 5.1 


Normal 

Sesgada a la derecha 

Sesgada a la Izquierda 

Uniforme 

67 

69 

31 

40 

102 

87 

12.1 

11.6 

70 

62 

43 

24 

55 

104 

12.1 

11.6 

63 

67 

30 

29 

70 

75 

12.4 

12.0 

65 

59 

30 

24 

95 

80 

12.1 

11.6 

68 

66 

38 

27 

73 

66 

12.1 

11.6 

60 

65 

26 

35 

79 

93 

12.2 

11.7 

70 

63 

29 

33 

60 

90 

12.2 

12.3 

64 

65 

55 

75 

73 

84 

12.2 

11.7 

69 

60 

46 

38 

89 

73 

11.9 

11.7 

61 

67 

26 

34 

85 

98 

12.2 

11.7 

66 

64 

29 

85 

72 

79 

12.3 

11.8 

65 

68 

57 

29 

92 

35 

12.3 

12.5 

71 

61 

34 

40 

76 

71 

11.7 

11.8 

62 

69 

34 

41 

93 

90 

12.3 

11.8 

66 

65 

36 

35 

76 

71 

12.3 

11.8 

68 

62 

40 

26 

97 

63 

12.4 

11.9 

64 

67 

28 

34 

10 

58 

12.4 

11.9 

67 

70 

26 

19 

70 

82 

12.1 

11.9 

62 

64 

66 

23 

85 

72 

12.4 

12.2 

66 

63 

63 

28 

25 

93 

12.4 

11.9 

65 

68 

30 

26 

83 

44 

12.5 

12.0 

63 

64 

33 

31 

58 

65 

11.8 

11.9 

66 

65 

24 

25 

10 

77 

12.5 

12.0 

65 

61 

35 

22 

92 

81 

12.5 

12.0 

63 

66 

34 

28 

82 

77 

12.5 

12.0 
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refresco despachadas poruña máquina en envases de 12 onzas. En la figura 5-1 se muestra la distribución de cada uno 
de estos conjuntos de datos muéstrales. Las distribuciones de las cuatro muestras se ilustran mediante gráficas de 
puntos. 


G ráficas de puntos de estaturas, edades de casamiento, edades de fallecimiento 
y llenado de refresco 



11.6 11.8 12.0 12.2 12.4 

Figura 5-1 MINITAB, gráficas de cuatro distribuciones: normal, sesgada a la derecha, 
sesgada a la izquierda y uniforme. 


En la variable estatura se da la estatura de 50 mujeres adultas, en la variable edad de casamiento seda la edad de 
casamiento de 50 mujeres, en la variable edad de fallecimiento se da la edad defallecimiento de 50 mujeres y en la 
variable llenado de refresco se dan las cantidades de refresco despachadas en recipientes de 12 onzas. Cada muestra 
tiene 50 elementos (es de tamaño 50). Empleando la terminología aprendida en este capítulo: la distribución de las 
estaturas es mesocúrtlca, la distribución del llenado de refresco es platicúrtica, la distribución de las edades de casa¬ 
miento es sesgada a la derecha, y la distribución de las edades defallecimiento es sesgada a la Izquierda. 

EJEMPLO 1 Para hallar los valores correspondientes al sesgo y a la curtosis de las cuatro variables puede emplearse M INITAB. 
Seleccionando la secuencia "Stat=> Basic statistics^ Display descriptivestatistics", se obtiene el siguiente resultado: 

Estadísticos descritivos: estatura, edades de casamiento, edades de fallecimiento y llenado de refresco 


Variable 

N 

N* 

Mean 

StDev 

Skewness 

Kurtosis 

Height 

50 

0 

65.120 

2.911 

-0.02 

-0.61 

Wedage 

50 

0 

35.48 

13.51 

1.98 

4.10 

Obitage 

50 

0 

74.20 

20.70 

-1.50 

2.64 

Cola-fill 

50 

0 

12.056 

0.284 

0.02 

-1.19 


Como se ve, los valores dados para el sesgo de las distribuciones normal y uniforme son cercanos a 0; el sesgo es positivo para 
la distribución sesgada a la derecha y negativo para la distribución sesgada a la izquierda. 

EJEMPLO 2 Use EXCEL para hallar los valores de sesgo y curtosis correspondientes a los datos de la figura 5-1. Los nombres 
de las variables se Ingresan en A1:D1, los datos muéstrales se ingresan en A2:D51 y en cualquier celda vacía se Ingresa 
=COEFICIENTE.ASI M ETRIA(A2:A51) obteniéndose como resultado -0.0203. La fundón COEFICIENTE.ASI M ETRIA (B2: 
B51) da como resultado 1.9774, la función =COEFICIENTE.ASIM ETRIA(C2:C51) da como resultado -1.4986 y la función 
=COEFICIENTE.ASIM ETRIA(D2:D51) da como resultado 0.0156. Los valores de curtosis se obtienen mediante las funciones 
=CU RTOSI S(A 2:A 51) que da como resultado -0.6083, =CU RTOSIS(B 2:B 51) queda como resultado 4.0985, =CU RTOSIS(C2: 
C51) queda como resultado 2.6368 y =CU RTOSIS(D2:D51) que da como resultado -1.1889. Como puede observarse, EXCEL y 
M INITA B dan los mismos valores de curtosis y de sesgo. 

EJEMPLO 3 También se puede emplear STATISTIX para analizar los datos de la figura 5-1. Se selecciona I a secuencia "Statistics 
=> Summary Statistics => Descriptivestatistics" y se obtiene la ventana de diálogo que se muestra en la figura 5-2. 
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Figura 5-2 Ventana dediálogo deSTATISTIX. 

Obsérvese que N, M ean (media), SD (desviación estándar), Skew (sesgo) y Kurtosis (curtosis) fueron selecciona¬ 
dos como los estadísticos que se desean conocer. El resultado que se obtiene de STATISTIX es: 


Estadísticos descriptivos 


Variable 

N 

Mean 

SD 

Skew 

Kurtosis 

Cola 

50 

12.056 

0.2837 

0.0151 

-1.1910 

Height 

50 

65.120 

2.9112 

-0.0197 

-0.6668 

Obitage 

50 

74.200 

20.696 

-1.4533 

2.2628 

Wedage 

50 

35.480 

13.511 

1.9176 

3.5823 


Como los valores numéricos difieren ligeramente de los obtenidos con EXCEL y M INITAB, es claro que este 
software emplea métodos ligeramente diferentes para medir la curtosis y el sesgo. 

EJEMPLO 4 En SPSS con la secuencia "Analyze=> Descript¡veStat¡st¡cs=> Descriptives" se obtiene la ventana de diálogo 
que se presenta en la figura 5-3, en la cual se selecciona M ean (media), Std. deviation (desviación estándar), Kurtosis (curtosis) y 
Skewness (sesgo). SPSS da las mismas medidas de sesgo y curtosis que EXCEL y M INITAB. 


r -\ 



Figura 5-3 Ventana de diálogo de SPSS. 





































Problemas resueltos 129 


SPSS proporciona los siguientes resultados. 


E stadísticos descriptivos 



N 

M edia 

Desv. Estándar 

Sesgo 

Curtosis 


Estadístico 

Estadístico 

Estadístico 

Estadístico 

Error estándar 

Estadístico 

Error estándar 

Estatura 

50 

65.1200 

2.91120 

-.020 

.337 

-.608 

.662 

Casamientos 

50 

35.4800 

13.51075 

1.977 

.337 

4.098 

.662 

Defunciones 

50 

74.2000 

20.69605 

-1.499 

.337 

2.637 

.662 

Llenado 

50 

12.0560 

.28368 

.016 

.337 

-1.189 

.662 

N validada 

50 








EJEMPLO 5 Si se usa SAS para calcular los valores del sesgo y de la curtosis, se obtienen los resultados que se muestran a 
continuación. Estos resultados son prácticamente los mismos que se obtienen con EXCEL,MINITAB y SPSS. 


The MEANS Procedure 

Variable Mean Std Dev N Skewness Kurtosis 

fffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff 


Height 

65.1200000 

2.9112029 

50 

-0.0203232 

-0.6083437 

Wedage 

35.4800000 

13.5107516 

50 

1.9774237 

4.0984607 

Obitage 

74.2000000 

20.6960511 

50 

-1.4986145 

2.6368045 

Cola_fi.ll 

12.0560000 

0.2836785 

50 

0.0156088 

-1.1889600 


fffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff 


PROBLEMAS RESUELTOS 

MOMENTOS 

5.1 Encontrar: a) el primero, b) el segundo, c) el tercero y d) el cuarto momentos del conjunto 2, 3, 7, 8,10. 

SOLUCIÓN 

a) El primer momento o media aritmética es 

- ¿2 x 2 + 3 + 7 + 8+ 10 30 ¿ 

x= ^r = -s- = t =6 

b ) El segundo momento es 

_ 2 2 + 3 2 + 7 2 + 8 2 + 10 2 226 ^ 

~ N ~ 5 5 “ ' 

c) El tercer momento es 

YT _ E 2T 3 _ 2 3 + 3 3 + f + 8 3 + 10 3 _ 1 890 _ 

N 5 5 

d ) El cuarto momento es 


X 4 = 


J2x 4 


2 4 + 3 4 + 7 4 + 8 4 + 10 4 
5 


16 594 


= 3 318.8 


N 


5 
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5.2 Dado el conjunto de números del problema 5.1, encontrar: a) el primero, b) el segundo, c) el tercero y d) el 
cuarto momentos respecto de la media. 


SOLUCIÓN 

717 v\ E(X-X) (2 — 6 ) + (3 — 6 ) + (7 — 6 ) + (8 — 6 ) + (10 — 6 ) 0 „ 

- — -—- - -_-_u 


m 1 siempre es igual a cero debido a que X-X = X- X = Q (ver problema 3.16). 

b) m.- (X , ? )2 _ E(^-^) 2 _ (^6) 2 + (3-6) 2 + (7-6) 2 + (8-6) 2 + (10-6) 2 ^46_ 92 

Obsérvese que m 2 es la varlanzas 2 . 

, y ^3 xf (2 — 6) 3 + (3 — 6) 3 + (7 — 6) 3 + (8 — 6) 3 + (10 — 6) 3 -18 „ 

c > m 3 — (A-A) — -—-—-g- __ 5~ — 

w, ^4 £pr-X) 4 (2-6) 4 + (3-6) 4 + (7-6) 4 + (8-6) 4 + (10-6) 4 610 

a) ní4 — (A—A) —- — -—- - - —— izz 


5.3 Para el conjunto de números del problema 5.1, encontrar: a) el primero, b) el segundo, c) el tercero y d) el 
cuarto momentos respecto del origen. 

SOLUCIÓN 

, Ti ; ir £( 26 - 4 ) (2 — 4 ) + (3 — 4 ) + (7 — 4 ) + (8 — 4 ) + ( 10 — 4 ) „ 

M / £(^- 4) 2 (2 — 4) 2 + (3 — 4) 2 + (7 — 4) 2 + (8 — 4) 2 + (10 — 4) 2 66 „„ 

C) (jY £( jr ~ 4 ) 3 (2 — 4) 3 + (3 — 4) 3 + (7 — 4) 3 + (8 — 4) 3 + (10 — 4) 3 298 ^ 

d) _ £ (26 — 4) 4 _ (2 — 4) 4 + (3 — 4) 4 + (7 — 4) 4 + (8 — 4) 4 + (10 — 4) 4 _ 1 650 _ _^ Q 


5.4 Empleando los resultados de los problemas 5.2 y 5.3, verificar las siguientes relaciones entre los momentos: 

a) m 2 = m 2 — m[ 2 , b) m 3 = m 2 — 3m[m 2 + 2 m[ 3 y c) m A = m' A — 4m[m 2 + 6m[ 2 m 2 — 3m( 4 . 


SOLUCIÓN 

De acuerdo con el problema 5.3 se tiene m[ = 2 , m 2 = 13 . 2 , m 2 = 59.6 y m' A = 330 . Por lo tanto: 

a) m 2 = m 2 - m[ 2 = 13.2 - ( 2) 2 = 13.2 - 4 = 9.2 

b ) m 3 = m 3 - 3 m [ m 2 + 2m¡ 3 = 59.6 - (3)(2)(13.2) + 2(2) 3 = 59.6 - 79.2 + 16 = -3.6 
C) w 4 = m' A - 4 m [ m 3 + 6wí 2 W2 - 3 m'f = 330 - 4(2)(59.6) + 6(2) 2 (13.2) - 3(2) 4 = 122 

lo que coincide con el problema 5.2. 

5.5 Probar que: a) m 2 = m 2 — m[ 2 , b) = m 3 — 3m[m 2 + 2m'\ y c) m A = m' A — \m[m 3 + 6m[ 2 m 2 — 3 m[ 4 . 

SOLUCIÓN 

Si d = X - 4, entonces X = A + d, X = A + d y X - X = d - d, y por lo tanto: 

a) m 2 = (X- xf = {d- df = d 2 - 2 dd + d 2 

= d 2 — 2d 2 + c/~ = d 2 — d 2 = m 2 — m { 2 
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b) m 3 = (X - X) 3 = {d- df = (rf 3 - 3 d 2 d + 3 dd 2 - d 3 ) 

= í/ 3 — 3dd 2 + 3 rf 3 — <P = t/ 3 — 3 c/í/ 2 + 2í/ 3 = h ¡3 — 3m[?n 2 + 2/h¡ 3 

c) m 4 = (X - X) 4 = {d- d) 4 = (d 4 - 4 d 2 d + 6 d 2 d 2 - Ad<P + d 4 ) 

= d 4 - AdcP + ó^rf 2 - 4J 4 + d 4 = d 4 - AdcP + 6 d 1 ! 2 - 3 d 4 
= m'n — 4;h¡;»3 + 6;)í¡ 2 ;«2 — 3;h[ 4 

Por extensión de este método se pueden deducir fórmulas semejantes para m 5 , m 6 , etcétera. 


CÁLCULO DE MOMENTOS PARA DATOS AGRUPADOS 


5.6 Encuentre los primeros cuatro momentos respecto de la media para la distribución de estaturas del problema 
3.22. 


SOLUCIÓN 

Para facilitar los cálculos se pueden disponer como en la tabla 5.2, a partir de la cual se tiene 



8.91 

204.93 


Por lo tanto m¡ = 0 

m 2 = m' 2 - m[ 2 = 8.73 - ( 0 . 45) 2 = 8.5275 

m 3 = m’ 3 - 3m[m 2 + m¡ 3 = 8.91 - 3 ( 0 . 45 )( 8 . 73 ) + 2 ( 0 . 45) 3 = - 2.6932 
w? 4 = m'n — Am[m 3 + 6in[ 2 m 2 — 3m' 4 

= 204.93 - 4 ( 0 . 45 )( 8 . 91 ) + 6 ( 0 . 45 ) 2 ( 8 . 73 ) - 3 ( 0 . 45) 4 = 199.3759 


Tabla 5.2 


X 

u 

f 

fu 

fu 2 

fu 3 

fu 4 

61 

-2 

5 

-10 

20 

-40 

80 

64 

-1 

18 

-18 

18 

-18 

18 

67 

0 

42 

0 

0 

0 

0 

70 

1 

27 

27 

27 

27 

27 

73 

2 

8 

16 

32 

64 

128 


O 

i—1 

II 

w 

II 

S 

E fu = 15 

E fu 2 = 97 

E fu 3 = 33 

E fu 4 = 253 


5.7 Encontrar: a) m[, b ) m' 2 , c) m 3 , d ) m¡, e) m h f) m 2 , g) m 3 , h) m 4 , /) X,j) s, k) X 2 y /) X 3 para la distribución 
de la tabla 4.7 del problema 4.19. 

SOLUCIÓN 

Para facilitar los cálculos, disponerlos como en la tabla 5.3. 
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Tabla 5.3 


X 

u 

f 

fu 

fu 2 

fu 3 

fu 4 

70 

-6 

4 

-24 

144 

-864 

5 184 

74 

-5 

9 

-45 

225 

-1 125 

5 625 

78 

-4 

16 

-64 

256 

-1 024 

4 096 

82 

-3 

28 

-84 

252 

-756 

2 268 

86 

-2 

45 

-90 

180 

-360 

720 

90 

-1 

66 

-66 

66 

-66 

66 

-> 94 

0 

85 

0 

0 

0 

0 

98 

1 

72 

72 

72 

72 

72 

102 

2 

54 

108 

216 

432 

864 

106 

3 

38 

114 

342 

1026 

3 078 

110 

4 

27 

108 

432 

1 728 

6 912 

114 

5 

18 

90 

450 

2 250 

11 250 

118 

6 

11 

66 

396 

2 376 

14 256 

122 

7 

5 

34 

245 

1 715 

12 005 

126 

8 

2 

16 

128 

1 024 

8 192 


N =£ f = 480 

E fu = 236 

E fu 2 = 3 404 

E fu 3 = 6 428 

E fu 4 = 74 588 


a) 


b) 


0 


cf) 

e) 

f) 

9) 

h) 

i) 
i) 
k) 


/) 



m 1 = 0 

m 2 = mí - m[ 2 = 113.4667 - (1.9667) 2 = 109.5988 

m 3 = m 3 - 3 m[mí + 2m[ 3 = 857.0667 - 3( 1.9667)(113.4667) + 2(1.9667) 3 = 202.8158 
m 4 = m'n — 4/??(/ 7?3 + 6m[ 2 m 2 — 3 m[ 4 = 35 627.2853 


X = (A + d) = A 4- m[ — A + c 


S/» 

N 


= 94+ 1.9667 = 95.97 


í = v /»jj = V109.5988 = 10.47 

X 2 = (+ + í/)" = (+ 2 + 2+rf + c/ 2 ) = A 2 + 2+<i + d 2 = A 2 + 2Am[ + m 2 

= (94 ) 2 + 2(94)(1.9667) + 113.4667 = 9 319.2063 o 9 319 a cuatro cifras significativas. 

X 2 = (A + df = (A 2 + 3A 2 d + 3Ad 2 + d 3 ) = A 3 + 3 A 2 d + 3 Ad 2 + d 3 

= A 3 + 3A 2 m[ + 3Amí + mí = 915 571.9597 o 915 600 a cuatro cifras significativas. 
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COMPROBACIÓN DE CHARLIER 

5.8 Ilustrar el uso de la comprobación deCharlier en los cálculos del problema 5.7. 

SOLUCIÓN 

Para proporcionar la comprobación deseada, a la tabla 5.3 se agregan las columnas de la tabla 5.4 (con excepción de la 
columna 2, que por comodidad se repite en la tabla 5.3). 

En cada uno de los siguientes pares de fórmulas, los datos para la primera se toman de la tabla 5.4 y los datos para 
la segunda se toman de la tabla 5.2. La igualdad de los resultados en cada par proporciona la comprobación deseada. 


Tabla 5.4 


u + 1 

f 

f(u + l) 

f(u + l) 2 

f(u + l) 3 

f(u + l) 4 

-5 

4 

-20 

O 

O 

i—1 

-500 

2 500 

-4 

9 

-36 

144 

-576 

2 304 

-3 

16 

-48 

144 

-432 

1296 

-2 

28 

-56 

112 

-224 

448 

-1 

45 

-45 

45 

-45 

45 

0 

66 

0 

0 

0 

0 

1 

85 

85 

85 

85 

85 

2 

72 

144 

288 

576 

1 152 

3 

54 

162 

486 

1458 

4 374 

4 

38 

152 

608 

2 432 

9 728 

5 

27 

135 

675 

3 375 

16 875 

6 

18 

CO 

O 

I—1 

648 

3 888 

23 328 

7 

11 

77 

539 

3 773 

26 411 

8 

5 

40 

320 

2 560 

20 480 

9 

2 

18 

162 

1458 

13 122 


N = £ f 

£ f(u + 1) 

£ f(u + l) 2 

£ f(u + l) 3 

£ f(u + 1) 4 


= 480 

= 716 

= 4 356 

= 17 828 

= 122 148 


£/(« + O = 716 

£/w+ # = 236 + 480 = 716 
£/(« + l) 2 = 4 356 

£ fu 1 + 2 £ /« + N = 3 404 + 2 (236) + 480 = 4 356 
£/(« + l) 3 = 17 828 

I] fu 3 + 3 I] fu 2 + 3 ¿2 f u + N = 6 428 + 3(3 404) + 3(236) + 480 = 17 828 
£/(« + l) 4 = 122 148 

¿2 .fu 4 + 4 ¿2 fu 3 + 6 £ fu 2 + 4 £ fu + N = 74 588 + 4(6 428) + 6(3 404) + 4(236) + 480 = 122 148 

CORRECCIONES DE SHEPPARD PARA LOS MOMENTOS 

5.9 Emplear las correcciones de Sheppard para determinar los momentos respecto de la media para los datos: 
a) del problema 5.6 y b) del problema 5.7. 
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SOLUCIÓN 

a) m 2 corregido = m 2 - c 2 ¡ 12 = 8.5275 - 3 2 /12 = 7.7775 
m 4 corregido = m 4 -\c 2 m 2 +ñ^c 4 

= 199.3759 - i (3) 2 (8.5275) + ¿o (3) 4 
= 163.3646 

m 1 y m 3 no necesitan correcciones. 

b) m 2 corregido = m 2 - c 2 / 12 = 109.5988 - 4 2 /12 = 108.2655 
m 4 corregido = m 4 - ¡ c 2 m 2 +¿gC 4 

= 35 627.2853 - i (4) 2 (109.5988) + ¿g (4) 4 
= 34 757.9616 


SESGO 

5.10 Encontrar: a) el primer coeficiente de sesgo de Pearson y b) el segundo coeficiente de sesgo de Pearson para 
la distribución de los salarios de los 65 empleados de la empresa P& R (ver los problemas 3.44 y 4.18). 

SOLUCIÓN 


M edia = $279.76, mediana = $279.06, moda = $277.50 y desviación estándar s = $15.60. Por lo tanto: 


a) 


Primer coeficiente de sesgo 


media — moda 
S 


$279.76 - $277.50 
$15.60 


= 0.1448; o bien 0.14 


b) 


. 3 (media — mediana) 

Segundo coeficiente de sesgo =- 


3($279.76 - $279.06) 
$15.60 


= 0.1346; o bien 0.13 


Si se emplea la desviación estándar corregida [ver problema 4.21b)], estos coeficientes se convierten, respectivamen¬ 
te, en: 


a) 

b) 


Media - moda $279.76 - $277.50 


S corregida $15.33 

3 (media — mediana) 3 ($279.76 — $279.06) 


= 0.1474; o bien 0.15 


= 0.1370; o bien 0.14 


S corregida $15.33 

Como los coeficientes son positivos, la distribución tiene sesgo positivo (es decir, a la derecha). 


5.11 Encontrar los coeficientes: a) cuartil y b) percentll de sesgo para la distribución del problema 5.10 (ver proble¬ 
ma 3.44). 

SOLUCIÓN 


a) 

b) 


(?! = $268.25, Q 2 = P 50 = $279.06, Q 3 = $290.75, P 10 = D 1 = $258.12, y P 90 = D 9 = $301.00. Por lo tanto: 


Coeficiente cuartil de sesgo = 


0 3 -2Q 2 +0, _ $290.75 - 2($279.06) 4-$268.25 


Q 3 — Q i 


$290.75 - $268.25 


= 0.0391 


Coeficiente percentil de sesgo = 


P 90 - 2P 50 +P 10 _ $301.00 - 2($279.06) +$258.12 
P 90 -P ,o ~ $301.00 - $258.12 


= 0.0233 


5.12 Encontrar el coeficiente momento de sesgo, a 3 , a) en la distribución de las estaturas de los estudiantes de la 
universidad XYZ (ver problema 5.6) y b) en los CI délos niños de primarla (ver problema 5.7). 
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SOLUCIÓN 


a) m 2 = s 2 = 8.5275 y m 3 = -2.6932. Por lo tanto: 


m 3 m 3 —2.6932 
° 3 “ 7" “ (7mT)3 “ (783275)3 


= -0.1081 


o bien 


0.11 


Si se emplea la corrección de Sheppard para datos agrupados [ver problema 5.9a)], se tiene 

m 3 -2.6932 


a 3 corregido = 


(7 m 2 corregido) 3 (77.7775) 3 


= -0.1242 


o bien 


- 0.12 


b ) 


a _ '”3 ^ ,w 3 

3 í 3 ( 7^) 3 


202.8158 


= 0.1768 o bien 0.18 


(7109.5988 ) 3 

Si se emplea la corrección de Sheppard para datos agrupados [ver problema 5.9b)], se tiene 


a 3 corregido 


m 3 

( 7^2 corregido) 3 


202.8158 

(7108.2655 ) 3 


0.1800 


o 


0.18 


Obsérvese que ambas distribuciones son moderadamente sesgadas, la distribución a) a la izquierda (negativa¬ 
mente) y la distribución b) a la derecha (positivamente). La distribución b) es más sesgada que la distribución a); es 
decir, a) es más simétrica que b), lo que es evidente dado que el valor numérico (o el valor absoluto) del coeficiente 
de sesgo para b) es mayor que el valor del coeficiente de sesgo para a). 


CURTOSIS 


5.13 Encontrar el coeficiente momento decurtosis, a 4 , de los datos: a) del problema 5.6 y b) del problema 5.7. 


SOLUCION 

a) 


a4= m, = m, = 1993759 =2J418 


mi (8.5275) 


o bien 


SI se emplean las correcciones de Sheppard [ver problema 5.9a)], entonces 


a 4 corregido = 


m 4 corregido 163.36346 


(m 2 corregido ) 2 (7.7775 ) 3 


= 2.7007 


2.74 


o bien 


2.70 


b) 


m 4 m 4 35 627.2853 
a 4 = -4 = -4 =-t = 2.9660 


mi (109.5988) 


o bien 


2.97 


SI se emplean las correcciones de Sheppard [ver problema 5.9b)], entonces 

m 4 corregido 34 757.9616 

a 4 corregido =-~ ~ = 2.9653 o bien 2.97 

(m 2 corregido)" (108.2655)" 

Como en una distribución normal a 4 = 3, se sigue que ambas distribuciones, a) y b), son platicúrticas con 
respecto a la distribución normal (es decir, menos puntiagudas que la distribución normal). 

En lo que se refiere a qué tan puntiagudas son, la distribución b) se aproxima a la distribución normal más que 
la distribución a). Sin embargo, de acuerdo con el problema 5.12, la distribución a) es más simétrica que la distribución 
b), de manera que en lo que se refiere a la simetría, a) se aproxima más a una distribución normal queb). 


CÁLCULO DEL SESGO Y DE LA CURTOSIS EM PLEANDO SOFTWARE 

5.14 Algunas veces las puntuaciones de un examen no siguen una distribución normal, aunque generalmente lo 
hacen. A Igunas veces se observa que los estudiantes obtienen puntuaciones altas o bajas y que hay pocas pun¬ 
tuaciones Intermedias. La distribución que se muestra en la figura 5-4 es una de estas distribuciones. Este tipo 
de distribuciones se conocen como distribuciones en forma de U. Empleando EXCEL, encontrar la media, la 
desviación estándar, el sesgo y la curtosis de estos datos. 
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G ráfica de puntos de las puntuaciones 



Puntuaciones 


Figura 5-4 MINITAB, gráfica de puntos con datos que siguen una distribución en forma deU. 


SOLUCIÓN 

En una hoja de cálculo de EXCEL se ingresan los datos en A 1:A 30. El comando "=AVERAGE(A1;A30)" da como resul¬ 
tado 50. El comando "=STDEV(A1:A30)'' da como resultado 29.94. El comando " =SKEW(A1:A30)" da como resulta¬ 
do 0. El comando " =KURT(A1;A30)" da como resultado -1.59. 


PROBLEMAS SUPLEMENTARIOS 


MOMENTOS 

5.15 Encontrar el: a) primero, b) segundo, c) tercero y d) cuarto momentos del conjunto 4, 7, 5, 9, 8 , 3, 6 . 

5.16 Encontrar el: a) primero, b ) segundo, c) tercero y d) cuarto momentos respecto de la media para el conjunto de datos del 
problema 5.15. 

5.17 Encontrar el: a) primero, b ) segundo, c) tercero y d) cuarto momentos respecto del número 7 para el conjunto de datos del 
problema 5.15. 

5.18 Empleando los resultados de los problemas 5.15 y 5.17, verificar las siguientes relaciones entre los momentos: 

a) m 2 = m 2 — m' 2 , b ) m 3 = / 7¡3 — 3m[m 2 + 2 m[ 3 y c) m 4 = m 4 — + 6m[ 2 m 2 — 3 m[ 4 . 

5.19 En el conjunto de números de la progresión aritmética 2, 5, 8,11,14,17, encontrar los primeros cuatro momentos respec¬ 
to de la media. 

5.20 Probar que: a) m' 2 = m 2 -I- h 2 , b) mí = m 3 + 3/im 2 + h 2 y c) m[ = m 4 + 4 / 7/773 + 6h 2 m 2 + ó 4 , donde h = m[. 

5.21 SI el primer momento respecto del número 2 es igual a 5, ¿cuál es la media? 

5.22 Si los primeros cuatro momentos respecto del número 3 son -2,10, -25 y 50, determinar los momentos correspondientes: 

a) respecto de la media, b ) respecto del número 5 y c) respecto del cero. 

5.23 Para los números 0, 0, 0,1,1,1,1 y 1, encontrar los primeros cuatro momentos respecto de la media. 

5.24 a) Probar que m 5 = m$ — 5m[mí + \0m' 2 mí — \0m' 2 m 2 + 4 / 7 ?{ 5 . 

b) Deducir una fórmula similar para m 6 . 

5.25 De un total de N números, la fracción p son unos y la fracción q = 1 - p son ceros. Encontrar: a) m lt b ) m 2 , c) m 3 y d) m 4 
para este conjunto de números. Comparar con el problema 5.23. 

5.26 Probar que los primeros cuatro momentos respecto de la media en la progresión geométrica a, a + d, a + 2d,.... a + 

(n - 1 )d son m 1 = 0, m 2 = ¿(n 2 - l)d 2 , m 3 = 0 y m 4 = ^(n 2 - l)(3n 2 - 7)d 4 . Comparar con el problema 5.19 (ver 

también el problema 4.69). [Sugerencia: l 4 + 2 4 + 3 4 + ■■■+ (n - l) 4 = ^n(n - l)(2n - l)(3n 2 -3 n - 1).] 
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MOMENTOS PARA DATOS AGRUPADOS 

5.27 Dada la distribución de la tabla 5.5, calcular los cuatro momentos respecto de la media. 


Tabla 5.5 


X 

f 

12 

1 

14 

4 

16 

6 

18 

10 

20 

7 

22 

2 


Total 30 


5.28 Ilustrar el uso de la comprobación de Charlier para los cálculos del problema 5.27. 

5.29 A pilcar las correcciones de Sheppard a los momentos obtenidos en el problema 5.27. 

5.30 Dada la distribución del problema 3.59, calcular los primeros cuatro momentos respecto de la media: a) sin correcciones 
de Sheppard y b ) con correcciones de Sheppard. 


5.31 Dada la distribución del problema 3.62, encontrara) m 1( b) m 2 , c) m 3 ,d) m 4 , e) X, f) s, g) X 1 , h) X 3 , i) X 4 y j) (X + l) 3 . 

SESGO 

5.32 Encontrar el coeficiente momento de sesgo, a 3 , para la distribución del problema 5.27: a) sin correcciones y b) con correc¬ 
ciones de Sheppard. 

5.33 Encontrar el coeficiente momento de sesgo, a 3 , para la distribución del problema 3.59 (ver problema 5.30). 

5.34 Los segundos momentos respecto de la media dedos distribuciones son 9 y 16, en tanto que los terceros momentos respec¬ 
to de la media son -8.1 y -12.8, respectivamente. ¿Qué distribución es más sesgada a la izquierda? 

5.35 Encontrar los coeficientes de Pearson: a) primero y b) segundo para la distribución del problema 3.59 y explicar cualquier 
diferencia que se encuentre. 

5.36 Encontrar los coeficientes de sesgo: a) cuartil y b ) percentil para la distribución del problema 3.59. Comparar sus resultados 
con los del problema 5.35 y explicar. 

5.37 En la tabla 5.6 se dan tres distribuciones diferentes de la varlableX. Las frecuencias de cada una de las tres distribuciones 
están dadas por f v f 2 y f 3 Encontrar el primero y el segundo coeficientes de sesgo de Pearson de las tres distribuciones. 
Para calcular los coeficientes, emplear la desviación estándar corregida. 


X 

0 

1 

2 

3 

4 


10 

5 

2 

2 

1 


1 

2 

14 

2 

1 


h 

1 

2 

2 

5 

10 


Tabla 5.6 
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CURTOSIS 

5.38 Encontrar el coeficiente momento de curtosis, a 4 , para la distribución del problema 5.27: a) sin correcciones y b) con 
correcciones de Sheppard. 

5.39 Encontrar el coeficiente momento de curtosis, a 4 , de la distribución del problema 3.59: a) sin correcciones y b) con correc¬ 
ciones de Sheppard (ver problema 5.30). 

5.40 Los cuartos momentos respecto de la media de las dos distribuciones del problema 5.34 son 230 y 780, respectivamente. 
¿Qué distribución se aproxima más a una distribución normal desde el punto de vista: a) de aplastamiento y b) del sesgo? 

5.41 ¿Cuál de las distribuciones del problema 5.40 es: a) Ieptocúrtica, b) mesocúrtica y c) platicúrtica? 

5.42 La desviación estándar de una distribución si métrica es 5. ¿Cuál deberá ser el valor del cuarto momento respecto déla media 
para que la distribución sea: a) leptocúrtica, b ) mesocúrtica y c) platicúrtica? 

5.43 a) Calcular el coeficiente percentil de curtosis, k, de la distribución del problema 3.59. 

b ) Comparar su resultado con el valor teórico 0.263 para una distribución normal, e interpretar. 

c) ¿Cómo se puede reconciliar este resultado con el del problema 5.39? 

CÁLCULO DEL SESGOY DE LA CURTOSIS EM PLEANDO SOFTWARE 

5.44 Los datos de la figura 5-5 muestran un pronunciado pico en 50. Esto debe mostrarse en la medida de la curtosis de los datos. 
Empleando EXCEL, mostrar que el sesgo es prácticamente cero y que la curtosis es 2.0134. 

35 
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F ¡gura 5-5 EXCEL, gráfica de los datos de puntuaciones de examen. 





TEORÍA ELEMENTAL 
DE LA PROBABILIDAD 



DEFINICIONES DE PROBABILIDAD 
Definición clásica 

Suponga que un evento E puede ocurrir en h den maneras igualmente posibles. Entonces la probabilidad de que ocu¬ 
rra el evento (a la que se le llama éxito) se denota como 

p= Pr( £} = h n 

La probabilidad deque no ocurra el evento (a la que se le llama fracaso) se denota como 

q = Pr{ no E } = = 1 — ^ = 1 — p = 1 — Pr| Ej 

Por lo tanto, p + q = 1 o bien Pr{E} + Pr{no E} = 1. El evento "no E " suele denotarse E, É o bien ~E. 

EJEMPLO 1 Cuando se lanza un dado, éste puede caer de seis maneras distintas. 

U n evento E de que caiga un 3 o un 4 es: 



y la probabilidad deE es Pr{E} = 2/6 o bien 1/3. La probabilidad de no obtener un 3 o un 4 (es decir, la probabilidad de obtener 
1, 2, 5 o bien 6) esPrj E) =l-Pr(E¡ =2/3. 

Obsérvese que la probabilidad de un evento es un número entre 0 y 1. Si el evento no puede ocurrir, su probabi¬ 
lidad es 0. En cambio, si se trata de un evento que tiene que ocurrir (es decir, que es seguro que ocurra), su proba¬ 
bilidad es 1. 

Si p es la probabilidad de que ocurra un evento, las posibilidades u oportunidades a favor de su ocurrencia son 
p : q (que se lee “p a q"); las posibilidades en contra deque ocurra son q : p. Por lo tanto, las posibilidades en contra 
de que en un solo lanzamiento de un dado caiga un 3 o un 4 son q: p= = : ± = 2 : 1 (es decir, 2 a 1). 


139 
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Definición de frecuencia relativa 

La definición clásica de probabilidad tiene la desventaja de que la expresión "igualmente posible” es vaga. Es más, 
como esta expresión parece ser sinónimo de "igualmente probable", la definición es circular, ya que está definiendo 
probabilidad en términos de probabilidad. Debido a esto, algunas personas han abogado poruña definición estadística 
de probabilidad. De acuerdo con esto, se considera que la probabilidad estimada o probabilidad empírica de un even¬ 
to es la frecuencia relativa de ocurrencia del evento cuando la cantidad de observaciones es muy grande. La probabi¬ 
lidad misma es el límite de esta frecuencia relativa a medida que la cantidad de observaciones aumenta de manera 
indefinida. 

EJEMPLO 2 Si en 1 000 lanzamientos de una moneda se obtienen 529 caras, la frecuencia relativa con la que se obtienen caras 
es 529/1 000 = 0.529. Si en otros 1 000 lanzamientos se obtienen 493 caras, la frecuencia relativa en los 2 000 lanzamientos es 
(529 + 493)/2 000 = 0.511. De acuerdo con la definición estadística, cada vez se estaría más cerca de un número que representa 
la probabilidad de que caiga cara en un lanzamiento de una sola moneda. Según los resultados presentados, este número sería 0.5 a 
una cifra significativa. Para obtener más cifras significativas se necesitan más observaciones. 

La definición estadística, aunque útil en la práctica, tiene dificultades desde el punto de vista matemático, ya que 
puede ser que no exista un verdadero número límite. Debido a esto, la teoría de probabilidad moderna ha sido desarro¬ 
llada en forma axiomática; es decir, el concepto de probabilidad se deja sin definir, que es lo mismo que ocurre en la 
geometría con los conceptos d epunto y línea, que también se dejan sin definir. 

PROBABILIDAD CONDICIONAL; EVENTOS INDEPENDIENTES Y DEPENDIENTES 

Si E 1 y E 2 son dos eventos, la probabilidad de que ocurra E 2 , dado qu eE 1 ha ocurrido, se denota Pr{E 2 |E 1 } o Pr{E 2 
dado EJ y se conoce como la probabilidad condicional deE 2 dado queE 3 ha ocurrido. 

Si la ocurrencia o no ocurrencia deE 3 no afecta la probabilidad de ocurrencia deE 2 , entonces Pr{E 2 |E 1 } = Pr{E 2 } 
y se dice que E 1 y E 2 son eventos independientes, de lo contrario se dice que son eventos dependientes. 

Si se denota con E 3 E 2 el evento de que "tanto E 1 como E 2 ocurran", evento al que suele llamarse evento compues¬ 
to, entonces 

Pr{ E,E 2 ) = Pr{ Ejj Pr{ E 2 \E t \ (1) 

En particular, 

Pr(E 1 E 2 ) = Pr( Ejj Pr{ E 2 j para eventos independientes (2) 

Para tres eventos E 1 ,E 2 yE 3 , tenemos 

Pr{ E,E 2 E 3 ) = Pr{ Ejj Pr{ E 2 |E a j Pr| E 3 |E 1 E 2 j (3) 

Es decir, la probabilidad de que ocurra E 1; E 2 y E 3 es igual a (la probabilidad deE 3 ) x (la probabilidad de E 2 dado que 
E 2 ha ocurrido) x (la probabilidad deE 3 dado queE 3 y E 2 han ocurrido). En particular, 

Pr{ EjE 2 E 3 ) = Prj Ejj Prj E 2 ) Prj E 3 ) para eventos independientes (4) 

En general, si E 1; E 2 , E 3 . E n son n eventos independientes que tienen probabilidades p lf p 2 , p 3 ,...,p n , entonces 

la probabilidad de que ocurra E 3 y E 2 y E 3 y ■■ ■ E n esp l p 2 p 3 ■■■ p n . 

EJEMPLO 3 Sean E 1 y E 2 los eventos "cae cara en el quinto lanzamiento" y "cae cara en el sexto lanzamiento" de una moneda, 
respectivamente. Entonces E 1 y E 2 son eventos independientes y, por lo tanto, la probabilidad de cara tanto en el quinto como en el 
sexto lanzamientos es (suponiendo que sea una moneda legal) 


PriEiEJ = Prj E,) Pr( E 2 ) 



1 

4 


EJEMPLO 4 Si la probabilidad de que A esté vivo en 20 años es 0.7 y la probabilidad de que 6 esté vivo en 20 años es 0.5, 
entonces la probabilidad de que ambos estén vivos en 20 años es (0.7)(0.5) = 0.35. 
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EJEMPLO 5 Supóngase que una caja contiene 3 pelotas blancas y 2 pelotas negras. Sea E 1 el evento "la primera pelota que se 
saca es negra" y E 2 el evento "la segunda pelota que se saca es negra", donde las pelotas no se vuelvan a colocar en la caja una vez 
sacadas. Aquí E 1 y E 2 son eventos dependientes. 

La probabilidad de que la primera pelota que se extraiga sea negra es Prj E¡] = 2/(3 +2) =|. La probabilidad de que la 
segunda pelota que se extraiga sea negra, dado que la primera pelota que se extrajo fue negra, es Prj E^Ej) = 1/(3 + 1) = ¿ Por 
lo tanto, la probabilidad de que las dos pelotas que se extraigan sean negras es 

Pr(E|E 2 | =Pr(E,| Prj E 2 |Ej| = 


EVENTOS MUTUAMENTE EXCLUYENTES 

Se dice que dos o más eventos son mutuamente excluyentes si la ocurrencia de uno cualquiera de ellos excluye la 
ocurrencia de los otros. Entonces, si E 1 y E 2 son eventos mutuamente excluyentes, Pr{E 1 E 2 } = 0. 

SI E 1 + E 2 denotan el evento "ocurre E x o E 2 o ambos", entonces 

Pr|Ei+E 2 j =Pr(E 1 | + Prj E 2 } - Prj E¡E 2 ] (5) 

En particular, 

Pr{ E¡ + E 2 ) = Prj E¡f + Prj E 2 } si los eventos son mutuamente excluyentes (6) 

Por extensión se tiene que si E v E 2 ,..., E n son n eventos mutuamente excluyentes que tienen probabilidadesp 2 , 

p 2 . p n , entonces la probabilidad de que ocurran E 1 oE 2 o ■■■E n esp 1 + p 2 -\ - pp„. 

La fórmula (5) también puede generalizarse a tres o más eventos mutuamente excluyentes. 

EJEMPLO 6 SI Ej es el evento "de una baraja se extrae un as" y E 2 es el evento "de una baraja se extrae un rey", entonces 

Prj Ej) = ^ = j^y Pr ( E 2 ) = = H' Y I a probabilidad de en una sola extracción se extrae un as o un rey es 

Prj E , + E-,) =Pr(E 1 ) +PrjE 2 ) =—+—=— 

1 1 2 13 13 13 

ya que en una sola extracción o se extrae un as o se extrae un rey, y por lo tanto estos eventos son mutuamente excluyentes (figura 
6 - 1 ). 
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F ¡gura 6-1 E^sel evento "extraer un as" yE 2 esel evento "extraer un rey". 

Obsérvese queE x y E 2 no tienen resultados en común. Estos eventos son mutuamente excluyentes. 

EJEMPLO 7 Si E 2 es el evento "extraer un as" y E 2 es el evento "extraer una espada" de una baraja, E 2 y E 2 no son mutuamen¬ 
te excluyentes, pues se puede extraer el as de espadas (figura 6-2). Por lo tanto, la probabilidad de extraer un as o una espada o 
ambos es 

4 13 1 16 4 

PrjE 1 +E 2 ¡ = Prj E x } + Prj E 2 } — Prj E[E 2 ) = — +-= —= — 

i 1 2i .ii 12 / ■ 1 2 ‘ 52 52 52 52 13 
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Figura 6-2 E 2 es el evento "extraer un as" y E 2 es el evento "extraer una espada". 
Obsérvese que el evento ‘‘E 1 y E 2 ", que consta de los resultados en los que se den los dos eventos, es el as de espadas. 
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DISTRIBUCIONES DE PROBABILIDAD 
Discretas 

Si una variableX toma un conjunto discreto de valoresX 1; X 2 ,...,X K con probabilidades respectivas p 1; p 2 ,..., p K , 

dondepj + p 2 H-h p K = 1, esto se define como una distribución de probabilidad discreta deX. La función p(X), 

que tiene los valores p 1; p 2 ,..., p K paraX =X 1 , X 2 ,...,X K , respectivamente, se llama función de probabilidad o fun¬ 
ción de frecuencia deX. Como X puede tomar ciertos valores con determinadas probabilidades, suele llamársele 
variable aleatoria discreta. A las variables aleatorias también se les conoce como variables estocásticas. 

EJEMPLO 8 Se lanza un par de dados; seaX la suma de los puntos obtenidos en estos dos dados. La distribución de probabilidad 
es la que se muestra en la tabla 6.1. Por ejemplo, la probabilidad deque la suma sea 5 es^= 1; así que de 900 veces que se lancen 
los dos dados se espera que en 100 la suma de los puntos sea 5. 

Obsérvese la analogía con las distribuciones de frecuencias relativas empleando probabilidades en lugar de fre¬ 
cuencias relativas. De manera que las distribuciones de probabilidad pueden considerarse como formas teóricas o 
formas límites ideales de las distribuciones de frecuencias relativas cuando la cantidad de observaciones es muy gran¬ 
de. A esto se debeque las distribuciones de probabilidad seconsideren distribuciones d e poblaciones, mientras que las 
distribuciones de frecuencias relativas son distribuciones de muestras obtenidas de estas poblaciones. 


Tabla 6.1 


X 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

P(X) 

1/36 

2/36 

3/36 

4/36 

5/36 

6/36 

5/36 

4/36 

3/36 

2/36 

1/36 


Una distribución de probabilidad se puede representar graficando p(X) contra X, como se hace con las distribucio¬ 
nes de frecuencias relativas (ver problema 6.11). 

Con probabilidades acumuladas se obtienen distribuciones de probabilidad acumulada, que son análogas a las 
distribuciones de frecuencia relativa acumulada. A las funciones correspondientes a estas distribuciones se les suele 
llamar funciones de distribución. 

La distribución de la tabla 6.1 puede obtenerse empleando EXCEL. La porción de una hoja de cálculo de EXCEL 
que se muestra a continuación se obtiene ingresando Dado 1 en Al, Dado 2 en B1 y Suma en Cl. Los 36 resultados 
posibles al lanzar dos dados se ingresan en A2:B37. En C2 se ingresa =SU M (A2:B2), se da clic y se arrastra desde C2 
hasta C37. Observando que la suma 2 se obtiene una vez; la suma 3, dos veces, etc., se forma la distribución de pro¬ 
babilidad de la tabla 6.1. 


Dado 1 Dado 2 

1 1 

1 2 

1 3 

1 4 

1 5 

1 6 

2 1 

2 2 

2 3 

2 4 

2 5 


Suma 

2 

3 

4 

5 

6 
7 

3 

4 

5 

6 
7 
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Dado 1 
2 
3 
3 
3 
3 
3 

3 

4 
4 
4 
4 
4 

4 

5 
5 
5 
5 
5 

5 

6 
6 
6 
6 
6 
6 


Dado 2 
6 
1 
2 

3 

4 

5 

6 
1 
2 

3 

4 

5 

6 
1 
2 

3 

4 

5 

6 
1 
2 

3 

4 

5 

6 


Continua 


Suma 

8 

4 

5 

6 

7 

8 
9 

5 

6 

7 

8 

9 

10 
6 

7 

8 

9 

10 
11 

7 

8 

9 

10 
11 
12 


Las ideas anteriores pueden extenderse al caso en el que la variableX puede tomar un conjunto continuo de valores. 
El polígono de frecuencias relativas de la muestra se convierte, en el caso teórico o límite de una población, en una 
curva continua (como la que se muestra en la figura 6-3) cuya ecuación es Y = p[X). El área total limitada por el eje 
X, bajo esta curva, es Igual a 1, y el área entre las rectas X = a y X = b (que aparece sombreada en la figura 6-3) 
corresponde a la probabilidad dequeX se encuentre entre a y b, lo que se denota como Pr{a < X < ó}. 



Figura 6-3 Pr{a<X < b} es el área sombreada bajo la función de densidad. 
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A p(X) se le conoce como función de densidad de probabilidad o brevemente función de densidad, y cuando se da 
una de estas funciones se dice que se define una distribución de probabilidad continua paraX; a la variableX suele 
llamársele variable aleatoria continua. 

Como en el caso discreto, se pueden definir distribuciones de probabilidad acumulada y las funciones de distribu¬ 
ción correspondientes. 

ESPERANZA MATEMÁTICA 

SI p es la probabilidad de que una persona reciba una cantidad de dinero S, pS define la esperanza matemática (o 
simplemente la esperanza). 

EJEMPLO 9 Encontrar E (X) para la distribución de la suma de los dos dados dada en la tabla 6.1. La distribución se presenta 
en los siguientes resultados de EXCEL. En A2:B12 se presenta la distribución en la que los valores p(X) se han convertido a la 
forma decimal. En C2 se ingresa la expresión =A2*B2, seda clic y se arrastra desde C2 hasta C12. En C13 se ingresa la expresión 
=Sum(C2:C12) y se obtiene la esperanza matemática, que es 7. 


X 

P(X) 

XP{X) 

2 

0.027778 

0.055556 

3 

0.055556 

0.166667 

4 

0.083333 

0.333333 

5 

0.111111 

0.555556 

6 

0.138889 

0.833333 

7 

0.166667 

1.166667 

8 

0.138889 

1.111111 

9 

0.111111 

1 

10 

0.083333 

0.833333 

11 

0.055556 

0.611111 

12 

0.027778 

0.333333 


7 


El concepto de esperanza es fácil de extender. SI X denota una variable aleatoria discreta que puede tomar los 

valores X 2 , X 2 ,...,X K con probabilidades p v p 2 ,..., p K , respectivamente, donde p 1 + p 2 H-h p K = 1, la esperanza 

matemática deX (o simplemente la esperanza deX), que se denota E(X ), se define de la manera siguiente: 


K 

E{X) = P\X\ +p 2 X 2 + ■ ■ ■ + Pk^k = Y pj x j = Y p x (7) 

7=1 

SI en esta esperanza se sustituyen las probabilidades p y por las frecuencias relativas f¡/N, donde TV = despe¬ 
ranza se reduce a Q2fX)/N, que es la media aritmética X de una muestra de tamaño N en la queX 2 , X 2 ,..., X K se 
presentan con estas frecuencias relativas. A medida que N se vuelve cada vez más grande, las frecuencias relativas 
fj/N se aproximan a las probabilidades^. Esto lleva a Interpretar E(X) como la media de la población déla que ha sido 
tomada la muestra. SI se denota con mala media muestral, a la media pobl acional se le denota con la correspondiente 
letra griega, p (mu). 

La esperanza también puede ser definida para variables aleatorias continuas, pero esta definición requiere el uso 
del cálculo. 

RELACIÓN ENTRE MEDI A Y VARIANZAPOBLACIONAL ES Y MUESTRALES 

SI de una población se toma en forma aleatoria una muestra de tamaño N (es decir, de manera que todas las muestras 
de tamaño N sean Igualmente probables), se puede demostrar que el valor esperado para la media muestral m es la 
media poblacional p. 
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Sin embargo, no se sigue que el valor esperado de cualquier cantidad calculada a partir de una muestra sea la can¬ 
tidad poblacional correspondiente. Por ejemplo, el valor esperado de la varianza muestral, como se ha definido aquí, 
no es la varianza poblacional, sino (N - 1)/N veces esta varianza. A esto se debe que algunos especialistas en estadís¬ 
tica prefieran definir la varianza muestral como la varianza aquí definida pero multiplicada por N/(N - 1). 

ANALISIS COMBINATORIO 

Para obtener probabilidades de eventos complejos, hacer una enumeración de los casos suele ser difícil, tedioso o ambas 
cosas. Para facilitar esta tarea se hace uso de los principios básicos de una materia llamada análisis combinatorio. 

Principio fundamental 

SI un evento puede ocurrir de n 2 maneras diferentes, y si una vez que ha ocurrido, otro evento puede ocurrir de n 2 
maneras diferentes, entonces la cantidad de maneras en que pueden ocurrir los dos eventos, en este orden específico, 

es n 1 n 2 - 

EJEMPLO 10 En una hoja de cálculo de EXCEL se Ingresan los números O a 5 en las casi11as A1 a A6. En B1 se ingresa 
=FACT(A1), se hacedle y se arrastra desde B1 hasta B 6. Después, para graficar los puntos, se emplea el asistente para gráficos de 
EXCEL. La función =FACT(n) es lo mismo que ni Para n = 0,1, 2, 3, 4 y 5 =FACT(n) es igual a 1,1, 2, 6, 24 y 120. La figura 
6-4 se generó con el asistente para gráficos de EXCEL. 


140 

120 

100 

80 

c 

60 
40 
20 
O 

0 1 2 3 4 5 6 

n 

Figura 6-4 Gráfica den! generada con EXCEL. 

EJEMPLO 11 La cantidad de permutaciones de las letras a, b y c tomadas dedos en dos es 3 P 2 = 3 • 2 = 6. Estas permutaciones 
son ab, ba, ac, ca, be y cb. 

El número de permutaciones den objetos de los cuales n 1 son ¡guales, n 2 son ¡guales,... es 

ni 

— T — donde n= n, + rh-\ - (10) 

fi|!n 2 ! • • • 



EJEMPLO 12 El número de permutaciones de las letras en la palabra statistics es 


10 ! 

3! 3! 1! 2! 1! 


= 50 400 


ya que hay 3 eses, 3 tes, la, 2 íes y 1 c. 
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COMBINACIONES 

U na combinación de n objetos diferentes tomados de r en r es una selección de r de los n objetos sin importar el orden. 
El número de combinaciones den objetos tomados der en r se denota mediante el símbolo Q y está dado por 



( 11 ) 


EJEMPLO 13 El número de combinaciones que se pueden hacer con las letras a, b, y c, tomadas de dos en dos, es 



Estas combinaciones son ab, ac y be. Obsérvese queaó es la misma combinación queda, pero no la misma permutación. 

Con EXCEL, las combinaciones de 3 objetos tomando 2 a la vez se obtienen con el comando =COM BIN (3,2), que 
da como resultado 3. 

APROXIMACIÓN DE STIRLING PARAn! 

Cuando n es grande es poco práctico evaluar directamente n! En tales casos se hace uso de una fórmula de aproxima¬ 
ción desarrollada por J ames Stirllng: 



( 12 ) 


donde e = 2.71828... es la base del logaritmo natural (ver problema 6.31). 

RELACIÓN ENTRE LA PROBABI LI DAD Y LA TEORÍA DE CONJ UNTOS 

Como se ve en la figura 6-5, un diagrama de Venn representa, mediante un rectángulo, todos los resultados posibles 
de un experimento, a lo que se llama el espacio muestra! S. Los eventos se representan como figuras tetraédricas o 
como círculos dentro del espacio muestral. SI S contiene únicamente una cantidad finita de puntos, entonces a cada 
punto se le puede asociar un número no negativo, llamado probabilidad, de manera que la suma de todos los números 
correspondientes a los puntos deS sea 1. Un evento es un conjunto (o una colección) de puntos en S, como los Indica¬ 
dos en la figura 6-5 porE 3 y E 2 . 

DIAGRAMAS DE EULER O DE VENN Y PROBABILIDAD 

El evento E 1 + E 2 es el conjunto de puntos que están en E 1 o en E 2 o en ambos, mientras que el evento E 2 E 2 es el 
conjunto de puntos que son comunes a ambos, E 1 yE 2 - La probabilidad de un evento por ejemplo el evento E 1 es la 
suma de las probabilidades correspondientes a todos los puntos que están en el conjunto E r De igual manera, la pro¬ 
babilidad de E 1 + E 2 , que se denota Pr{E x -i- E 2 }, es la suma délas probabilidades correspondientes a todos los puntos 
contenidos en el conjunto E 2 + E 2 . SI E 1 y E 2 no tienen puntos en común (es decir, si los eventos son mutuamente 
excluyentes), entonces Pr{E 1 + E 2 } = Pr{E 2 } + Pr{E 2 }. Si tienen puntasen común, entonces PrjEj + Ej} = Pr{E 2 } 
+ Pr{E 2 }-Pr{E 1 E 2 }. 

El conjunto E 3 + E 2 también suele denotarse E 1 u E 2 y se conoce como la unión de los dos conjuntos. El conjun¬ 
to E X E 2 también suele denotarse E 1 n E 2 y se conoce como la intersección de los dos conjuntos. Se pueden hacer 
extensiones a más de dos conjuntos; así, en lugar deE x + E 2 + E 3 y E 1 E 2 E 3 , se pueden emplear las notacionesEi u 
E 2 uE 3 yE 1 nE 2 nE 3 , respectivamente. 
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DIAGRAMAS DE EULER 0 DE VENN Y PROBABILIDAD 



a) 



S 


b) 



c) 


_ S 

d) 

Figura 6-5 0 peraciones con eventos, a) EI complemento del evento E aparece sombreado y se denota É; 
b) la intersección de los eventos E x y E 2 aparece sombreada y se escribe E 1 n E 2 ; c) la unión délos 
eventos E 1 yE 2 aparece sombreada y se denota E x u E 2 . d ) los eventos E j y E 2 son mutuamente 

exduyentes, es decir, E 1 DE 2 = <f>. 


El símbolo 4> (la letra f¡ del alfabeto griego) suele emplearse para denotar el conjunto que no tiene ningún punto, 
conjunto al que se le conoce como conjunto vacío. La probabilidad que se le asigna a un evento que corresponde a este 
conjunto escero (es decir, Pr{</} = 0). Si E 1 yE 2 no tienen puntasen común, seescr¡beE 1 E 2 = <?í>, lo que significa que 
los eventos correspondientes son mutuamente exduyentes, por lo que Pr{E 1 E 2 } = 0. 

Con esta visión moderna, una variable aleatoria es una función definida en cada punto de un espacio muestral. Por 
ejemplo, en el problema 6.37, la variable aleatoria es la suma de las coordenadas de cada punto. 

Empleando conceptos del cálculo pueden extenderse las ¡deas anteriores al caso en el queS tenga una cantidad 
Infinita de puntos. 

EJEMPLO 14 Un experimento consiste en lanzar un par de dados. El evento E 1 es que se obtenga un 7, es decir, que la suma de 
los puntos en los dados sea 7. El evento E 2 es que en el dado 1 se obtenga un número non. A continuación se presenta el espacio 
muestral S y los eventos E : y E 2 . Encontrar PrjEj}, Pr{E 2 }, Pr{E x n E 2 } y Pr{E x u E 2 }. En la figura 6.6 se presentan los resulta¬ 
dos de M INITAB con E v E 2 y S en rectángulos separados. 

P(Ei) = 6/36=1/6 P(E 2 ) = 18/36=1/2 P(E\ D E 2 ) = 3/36 = 1/12 
P{E X U E 2 ) = 6/36 + 18/36 - 3/36 = 21/36. 
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Espacio muestral S 


6 - 

• 

• 

• 

• 

• 

• 

6 - 

• 

• 

• 


5 - 

• 

• 

• 

• 

• 

• 

5 - 

• 

• 

• 


4 - 

• 

• 

• 

• 

• 

• 

4 - 

• 

• 

• 


3 - 

• 

• 

• 

• 

• 

• 

3 - 

• 

• 

• 


2 - 

• 

• 

• 

• 

• 

• 

2 - 

• 

• 

• 


1 - 

• 

• 

• 

• 

• 

• 

1 - 

• 

• 

• 



1 

2 

3 

4 

5 

6 


1 

2 3 4 

5 

6 

6 - 

• 



Evento E 2 




5 - • 

4 - • 

3 - • 

2 - • 

1 - • 

- 1 - 1 - 1 - 1 - 1 - 1 - 

1 2 3 4 5 6 

Evento E j 

Figura 6-6 Resultados de M INITAB para el ejemplo 14. 


PROBLEMAS RESUELTOS 


REGLAS FUNDAMENTALES DE LA PROBABILIDAD 

6.1 Determinar o estimar la probabilidad p de cada uno de los eventos siguientes: 

a) AI lanzar una vez un dado obtener un número non. 

b) AI lanzar dos veces una moneda obtener por lo menos una cara. 

c) AI sacar una carta de una baraja, bien barajada, con 52 cartas obtener un as, un 10 de diamantes o un 2 de 
espadas. 

d ) Al lanzar una vez un par de dados su suma sea siete. 

e) SI en 100 lanzamientos de una moneda se obtuvieron 56 caras, en el siguiente lanzamiento obtener una 
cruz. 

SOLUCIÓN 

a) De seis casos equiprobables posibles, tres casos (que caiga 1, 3 o 5) son favorables al evento. Por lo tanto, 

n = 2 = 1 

r 6 2’ 

b) Si H denota "cara" y T denota "cruz", en los dos lanzamientos se pueden obtener los casos siguientes: HH, HT, TH, 
TT, todos Igualmente posibles. De éstos, sólo los tres primeros son favorables al evento. Por lo tanto, p = |. 

c) Este evento puede darse de seis maneras (as de espadas, as de corazones, as de tréboles, as de diamantes, 10 de dia¬ 
mantes y 2 de espadas) en los 52 casos Igualmente posibles. Por lo tanto, P = ^ 

d) Cada una de las caras de un dado puede relacionarse con cada una de las seis caras del otro dado, de manera que la 

cantidad de casos que pueden presentarse, todos igualmente posibles, es 6 ■ 6 = 36. Estos casos se pueden denotar 
(1,1), (2,1), (3,1).(6,6). 

Hay seis formas de obtener la suma de 7, denotada por (1, 6), (2, 5), (3, 4), (4, 3), (5, 2) y (6,1). Por lo tanto, 

n = A =1 
r 36 6 ' 

e) Como en 100 lanzamientos se obtuvieron 100 - 56 = 44 cruces, la probabilidad estimada (o empírica ) de que caiga 
cruz es la frecuencia relativa 44/100 = 0.44. 
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6.2 Un experimento consiste en lanzar una moneda y un dado. Si E 2 es el evento en que se obtenga "cara" al lanzar 
la moneda y E 2 es el evento en que se obtenga "3 o 6" al lanzar el dado, expresar en palabras cada uno de los 
eventos siguientes: 

a) E, c) EjE 2 

b) E 2 d) Pr| EjE 2 1 

SOLUCIÓN 

a) Cruz en la moneda y cualquier cosa en el dado. 

b ) 1, 2, 4 ó 5 en el dado y cualquier cosa en la moneda. 

c) Cara en la moneda y 3 ó 6 en el dado. 

d ) Probabilidad de cara en la moneda y 1, 2, 4 ó 5 en el dado. 

e) Probabilidad de cara en la moneda, dado que en el dado se obtuvo 3 ó 6. 

f) Probabilidad de cruz en la moneda o 1, 2, 4 ó 5 en el dado o ambas cosas 


e) Pr( Ei|E 2 ) 

f) Pr|E,+E 2 l 


6.3 De una caja que contiene 6 pelotas rojas, 4 pelotas blancas y 5 pelotas azules se extrae, de manera aleatoria, 
una pelota. Determinar la probabilidad deque la pelota extraída sea: a) roja, b) blanca, c) azul, d) no sea roja 
y e) sea roja o blanca. 

SOLUCIÓN 


Con R, 1/1/ y 6 se denotan los eventos de que la pelota que se saque sea roja, blanca o azul, respectivamente. Entonces: 


a) 

b) 

c) 

d) 


IV R 


maneras de sacar una pelota roja 6 

total de maneras de sacar una pelota 6+4 + 5 


6 _ 2 
TI " 5 


IV W 


4 

6+4+5 


4 

+5 


Pr : B 


5 

6+4+5 


5 

L5 


1 

3 


Pr¡ R) = 1 — Prj R) = 1 - - = - 


de acuerdo con el inciso a) 


e) 

Otro método 


maneras de sacar una pelota roja o una pelota blanca 

Pr; R + 1/1/; =-—-f- 

total de maneras de sacar una pelota 


6+4 
6+4 + 5 


10 _ 2 
15 ~~ 3 


12 

Pr| R + W) — Pr| B) = 1 — Prj 6) = 1 — - = - de acuerdo con el inciso C) 

Obsérvese que Pr{R + 1/1/} = Pr{R} + Pr{l/1/} (es decir, § = § + ^1. Éste es un ejemplo de la regla general 
Pr{£ x + E 2 } = Pr{EJ + Pr{E 2 } válida para eventos E 2 y E 2 mutuamente excluyentes. 

6.4 Un dado se lanza dos veces. Encontrar la probabilidad de obtener un 4, un 5 o un 6 en el primer lanzamiento y 
un 1, 2, 3 ó 4 en el segundo lanzamiento. 

SOLUCIÓN 

SeaE x el evento "4, 5 ó 6" en el primer lanzamiento y E 2 el evento “1, 2, 3 ó 4" en el segundo lanzamiento. A cada una de 
las seis maneras en que puede caer el dado en el primer lanzamiento se le asocia cada una de las seis maneras en que puede 
caer en el segundo lanzamiento, lo que hace un total de 6 ■ 6 = 36 maneras, todas igualmente probables. A cada una de las 
tres manera en que puede ocurrir E 2 se le asocia cada una de las cuatro maneras en que puede ocurrir E 2 , obteniéndose 
3 ■ 4 = 12 maneras en las que pueden ocurrir E 2 y E 2 o E X E 2 Por lo tanto, Pr{E x E 2 } = 12/36 = 1/3. 

Obsérvese que Pr{E 1 E 2 } = PrjEJ Pr{E 2 } (es decir, + = |. 4) es válido para eventos independientes E 2 y E 2 . 
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6.5 De una baraja, bien barajada, con 52 cartas se extraen dos cartas. Encuéntrela probabilidad de que las dos sean 

ases si la primera carta: a) se devuelve a la baraja y b) no se devuelve a la baraja. 

SOLUCIÓN 

Sea E x = evento "as" en la primera extracción y sea E 2 = evento "as" en la segunda extracción. 

a) SI la primera carta se devuelve a la baraja, E 1 y E 2 son eventos independientes. Por lo tanto, Pr{las dos cartas extraídas 
sean ases} = Pr}^} = Pr}^} Pr{£ 2 } = (£)(£) = ^. 

b ) La primera carta se puede extraer de 52 maneras y la segunda puede extraerse de 51 maneras, ya que la primera carta 
no se devuelve a la baraja. Por lo tanto, las dos cartas se pueden extraer de 52 ■ 51 maneras todas igualmente posi¬ 
bles. 

Hay cuatro maneras en las que puede ocurrir E x y tres maneras en las queE 2 puede ocurrir, de manera queE 2 y 
E 2 o EjE 2 puede ocurrir de 4 ■ 3 maneras. Por lo tanto, Pr {E X E 2 } = (4 • 3)/(52 ■ 51) = ¿y. 

Obsérvese que Pr{£ 2 |£' l } = Prjsegunda carta sea un as dado que la primera carta es un as} = 5 3 . De manera 
que este resultado ¡lustra la regla general Pr {E^E 2 } = Pr{£j} Vv{E 2 \E x } donde E 2 y E 2 son eventos dependientes. 


6.6 Déla caja del problema 6.3 se extraen, sucesivamente, tres pelotas. Encuéntrese la probabilidad de que se 
extraigan en el orden roja, blanca y azul: a) si cada pelota se devuelve a la caja y b) si no se devuelve. 

SOLUCIÓN 


Sea R = evento "roja" en la primera extracción, 1/1/ = evento "blanca" en la segunda extracción y B = evento "azul" en la 
tercera extracción. Lo que se busca es Pr{RI/l/6}. 

a) Si cada una de las pelotas se devuelve, entonces R, 1/1/ y 6 son eventos independientes y 


r< { RWB) - MR) r ;{<v) p,w - 

b ) SI las pelotas no se devuelven, entonces R, 1/1/ y B son eventos dependientes y 



8 
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Pr {RWBj = Pr {R} Rx{W\R} Rr{B\WR} 



5 + 3 + 5 


donde Pr{fí|l/l/R} es la probabilidad condicional de extraer una pelota azul si se han extraído ya una roja y una 
blanca. 


6.7 Encuéntrese la probabilidad de que en dos lanzamientos de un dado se obtenga por lo menos un 4. 

SOLUCIÓN 

Sea Ej = el evento "4" en el primer lanzamiento, E 2 = el evento "4" en el segundo lanzamiento y E 2 + E 2 = el evento "4" 
en el primer lanzamiento o "4" en el segundo lanzamiento o ambos = el evento de obtener por lo menos un 4. Lo que se 
busca es Pr{E 2 + E 2 }. 

Primer método 

Los dos dados pueden caer en un total de 6 ■ 6 = 36 maneras Igualmente posibles. Además, 

Cantidad de maneras en las que puede ocurrir E x pero no E 2 =5 
Cantidad de maneras en las que puede ocurrir E 2 pero no E x =5 
Cantidad de maneras en las que pueden ocurrir E x y E 2 =1 

Por lo tanto, la cantidad de maneras en las que puede ocurrir por lo menos uno de los eventos E x o E 2 es 5 + 5 + 1 = 11, 
y por lo tanto, Pr}^ + E 2 } = ü. 
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Segundo método 

Como Ej y £ 2 no son mutuamente excluyentes, Pr{E 2 + E 2 } = Pr{E x } + Pr{E 2 } - Pr{E 1 £ 2 }. Además, como E 2 y E 2 son 
independientes, Pr{E 2 E 2 } = Pr{E 2 } Pr{E 2 }. Por lo tanto, 

Pr{E i + E 2 } = Pr{Ej} + Pr{E 2 } - Pr{EJ Pr{E 2 } = ¡ + \ -©(|) = & 

Tercer método 

Prjobtener por lo menos un 4} + Pr{no obtener ningún 4} = 1. 

Por lo tanto, Prjobtener por lo menos un 4} = 1 — Pr{no obtener ningún 4} 

= 1 — Pr{no obtener un 4 ni en el primero ni en el segundo lanzamiento} 
= 1 - Pr{E|E 2 } = 1 - Pr{Ej) Pr{E 2 } 

= i-(D(D=i 


6.8 U na bolsa contiene 4 pelotas blancas y 2 pelotas negras; otra contiene 3 pelotas blancas y 5 pelotas negras. SI 
se saca una pelota de cada bolsa, encontrarla probabilidad deque: a) ambas sean blancas, b) ambas sean negras 
y c) una sea blanca y la otra sea negra. 

SOLUCIÓN 

Sea 1/1/! = el evento "blanca" de la primera bolsa y l/l/ 2 = el evento "blanca" de la segunda bolsa. 

a) Pr{ W¡ W 2 } = Pr{ W,} Pr{ 1 V 2 j = = * 

b ) Pr{ m m = Pr{ m } Pr{ W 2 } = ¿ 

c) El evento "una es blanca y la otra es negra" es lo mismo que el evento "o la primera es blanca y la segunda es negra 
o la primera es negra y la segunda es blanca"; es decir, w x W 2 + tV¡ W 2 . Como los eventos W¡ W 2 y W x W 2 son mutua¬ 
mente excluyentes, se tiene 

Pr{ W, W 2 + W x W 2 }= Pr{ W x W 2 } + Pr{ W x W 2 } 

= Pr{W x } Pr{ IV 2 } + Pr{ W x } Pr{l^ 2 } 


Otro método 

La probabilidad que se busca es 1 - Pr}^, W 2 } - Pr}^, 1V 2 } = 1 ¿ 


6.9 Ay B juegan 12 partidos de ajedrez, de los cuales, A gana 6, B gana 4 y en 2 terminan empatados. Se ponen de 
acuerdo para jugar otros 3 partidos. Encuéntrese la probabilidad deque: a) A gane los tres partidos, b) 2 parti¬ 
dos terminen empatados, c) A y B ganen alternadamente y d) B gane por lo menos un partido. 

SOLUCIÓN 


Sean A v A 2 y A 3 los eventos “A gana" en el primero, el segundo y el tercer partidos, respectivamente; sean B h B 2 y B 3 los 
eventos "B gana" el primero, el segundo y el tercer partidos, respectivamente, y D v D 2 y D 3 los eventos "terminan empa¬ 
tados" en el primero, el segundo y el tercer partidos, respectivamente. 

Sobre la base de experiencias anteriores (probabilidad empírica), asumir que Pr{A gana cualquiera de los partidos} 
= ^ = }, que Pr {6 gana cualquiera de los partidos} = ^ } y que Prjtermina en empate en cualquier partido} = ^ = i. 


a) Pr{A gane los tres partidos} = Pr{^í^ 2 ^ 3 } = Pr{-4 1 } Pr{^ 2 } Pr{^ 3 } 



1 

8 
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suponiendo que el resultado de cada partido sea independiente de los resultados de los otros partidos, lo que parece 
razonable (a menos, por supuesto, que el jugador se vea psicológicamente influenciado por los otros partidos ganados 
o perdidos). 

b ) Pr{2 partidos terminen empatados} = Pr{el primero y el segundo o el primero y el tercero o el segundo y el tercer 

partidos terminen empatados} 

= Pr{D¡D 2 D 2 } + Pr{D l D 2 D 3 ] + Pr{D l D 2 D 3 } 

= Pr{£>,} Pr{£> 2 } Pr{/) 3 } + Pr{Z>, } Pr {D 2 } Pr{D 3 } 

+ Pr{¿,}Pr{£> 2 } Pr{Z> 3 } 



c) Pr{/\ y 8 ganen alternadamente} = Pr{A gane y después 6 gane y después gane o que 6 gane y después A gane y 

después 6 gane} 

= Pr{A¡B 2 A 3 + B¡A 2 B 2 } = Pr{^4]5 2 ^4 3 } + Px{B\A 2 B 2 } 

= Pr{^} Pr{fí 2 } Pr{^ 3 } + Pr{5,} Pr {A 2 } Pr{fl 3 } 



d) Pr{6 gane por lo menos un partido} = 1 - Pr{6 no gane ningún partido} 

= 1 - Pr {B X B 2 B,} = 1 - Pr{5,} Pr{5 2 } Pr{5,} 



DISTRIBUCIONES DE PROBABILIDAD 

6.10 Encontrar la probabilidad de que haya niños o niñas en familias con tres hijos, suponiendo probabilidades 
¡guales para niños que para niñas. 

SOLUCIÓN 

Sea B = el evento "niño en la familia" y G = el evento "niña en la familia". De acuerdo con la suposición de probabilida¬ 
des ¡guales, Pr{5} = Pr{G} = |. En las familias con tres hijos pueden presentarse los siguientes eventos mutuamente 
excluyentes con las probabilidades que se indican. 

a) Tres niños (666): 

Pr {BBBj = Pr{5} Pr{5} Pr{5} = \ 

O 

Aquí se supone que el que nazca un niño no está influenciado de manera alguna porque el hijo anterior haya sido 
también niño, es decir, se supone que los eventos son independientes. 

b) Tres niñas (GGG): Como en el inciso a) o por simetría, 

Pr{GGG} = I 

c) Dos niños y una niña (BBG +BGB +GBB): 

Pr {BBG + BGB + GBB} = Pr {BBG} + Pr {BGB} + Pr {GBB} 

= Pr{5} Pr{£} Pr{G} + Pr{5} Pr{G} Pr{5} + Pr{G} Pr{5} Pr{5} 

_ 1 1 1 _ 3 

- 8 + 8 + 8 - 8 

cf) Dos niñas y un niño (GG6 + G6G + 6GG): como en el inciso c) o por simetría, la probabilidad es 3/8. 

Si X denota la variable aleatoria que indica la cantidad de niños en una familia con tres hijos, la distribución de 
probabilidad es la que se muestra en la tabla 6.2. 
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Tabla 6.2 


Cantidad de niños (hombres) X 

0 12 3 

Probabilidad p(X) 

1/8 3/8 3/8 1/8 


6.11 Graficar la distribución del problema 6.10. 

SOLUCIÓN 

La gráfica puede representarse ya sea como en la figura 6.7 o como en la figura 6.8. Obsérvese que en la figura 6.8 la suma 
délas áreas de los rectángulos es 1; en esta figura llamada histograma de probabilidad, X es considerada como una variable 
continua, aunque en realidad sea discreta, procedimiento que suele resultar útil. Por otro lado, la figura 6.7 se emplea cuan¬ 
do no se desea considerar a la variable como variable continua. 



Figura 6-7 SPSS, gráfica de la distribución de probabilidad. 



Niñcs 

Figura 6-8 MINITAB, histograma de probabilidad. 

















154 Capítulo 6 Teoría elemental de la probabilidad 


6.12 U na variable aleatoria continua X, que toma valores sólo entre 0 y 5, tiene una función de probabilidad dada 

por p{X) = ¡ 0 ' 2 ’ °. < X < , 5 . La gráfica se muestra en la figura 6.9. 

^ 0, si no es asi 

a) Verificar que es una función de densidad. 


0.25 

0.2 



o.i - 

0.05 - 


o 


0 1 2 3 4 5 6 

X 

Figura 6-9 Función de densidad de probabilidad para la varlableX. 


b) Encontrar y graficar Pr{2.5 <X < 4.0}. 

SOLUCIÓN 

a) La función p(X) es siempre > 0 y el área total bajo la gráfica dep(X) es 5 x 0.2 = 1, ya que tiene forma rectangular 
con 0.2 de ancho y 5 de largo (ver figura 6-9). 

b ) La probabilidad Pr{2.5 <X <4.0} se muestra en la figura 6.10. 


0.250 


0.225 


ÍS 0.200 
a. 


0.175 


0.150 



2 3 

X 

Figura 6-10 La probabilidad Pr{2.5 <X <4.0} aparece como un área sombreada. 


El área rectangular, Pr{2.5 < X < 4.0} es (4 - 2.5) x 0.2 = 0.3. 
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ESPERANZA MATEMÁTICA 

6.13 Se compra un boleto para una rifa con el que se puede ganar $5 000 como pri mer premio o $2 000 como segun¬ 
do premio, siendo las probabilidades 0.001 y 0.003, respectivamente. ¿Cuál sería el precio justo a pagar por un 
boleto? 

SOLUCIÓN 

La esperanza es ($5 000)(0.001) + ($2 000)(0.003) = $5 + $6 = $11, que es el precio justo a pagar. 

6.14 En una Inversión de negocios hay una probabilidad de 0.6 de obtener como ganancia $300 y una probabilidad 
de 0.4 de perder $100. Determinar la esperanza. 

SOLUCIÓN 

La esperanza es ($300)(0.6) + {—$100)(0.4) = $180 - $40 = $140. 

6.15 Encontrar: a) E(X), b) E(X 2 ) y c) E[(X - Jp) 2 )], para la distribución de probabilidad que se muestra en la ta¬ 
bla 6.3. 

d) Emplear EXCEL para dar la solución de los incisos a), b) y c). 


Tabla 6.3 


X 

8 

12 

16 

20 

24 

P(X) 

1/8 

1/6 

3/8 

1/4 

1/12 


SOLUCIÓN 

a) E(X) = Y Xp{X) = (8)(i) + (12)(i) + (16)(|) + (20)(j) + (24)(jL) = 16; lo que representa la media de la distri¬ 
bución. 

b ) E(X 2 ) = Y X 2 p(X) = (8) 2 (1) + (12) 2 (¿) + (16) 2 (|) + (20) 2 (1) + (24) 2 (¿) = 276; lo que representa el segundo 
momento respecto al origen cero. 

C) E[(X - xf\ = £(X - Xf P { X) = (8 - 16) 2 (i) + (12 - 16) 2 (i) + (16 - 16) 2 (|) + (20 - 16) 2 (i)+(24 - 16) 2 (i) 

= 20; lo que representa la varianza de la distribución. 

d) En A1:E1 se ingresan los títulos, como se muestra. Los valores deX y los valores de probabilidad se ingresan en A2: 
B6. Los valores esperados deX se calculan en C2:C7. El valor esperado se da en C7. El segundo momento respecto 
al origen se calcula en D2:D 7. El segundo momento aparece en D7. La varianza se calcula en E2:E7. La varianza se 
da en E7. 


A 

B 

C 

D 

E 

X 

P(X) 

Xp(X) 

X A 2p(X) 

(X - E(X)) A 2*p(X) 

8 

0.125 

1 

8 

8 

12 

0.166667 

2 

24 

2.666666667 

16 

0.375 

6 

96 

0 

20 

0.25 

5 

100 

4 

24 

0.083333 

2 

48 

5.333333333 



16 

276 

20 


6.16 Una bolsa contiene 2 pelotas blancas y 3 pelotas negras. Cada una de cuatro personas, A, B, C y D, en este 
orden, extrae una pelota y no la devuelve a la bolsa. La primera que extraiga una pelota blanca recibirá $10. 
D eterml nar I as esperanzas de A , B, C y D. 
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SOLUCIÓN 


Como sólo hay 3 pelotas negras, alguna de las personas deberá ganar en el primer intento. Sean , 6, C y D los eventos “A 
gana", "B gana", "C gana" y "D gana", respectivamente. 


Pr{/4 gane} = Pr{A} 


2 _ 2 
3 + 2~5 


Por lo tanto, la esperanza de= |($10) = $4. 


Pr{4 pierda y B gane} = Pr {AB} = Pr{^} Pr{B\A) 



3 

lo 


Por lo tanto, la esperanza de B = $3. 


Pr{4 y 6 pierdan y C gane} = Pr {ABC} = Pr{A} Pr{5|^} Pr {CAB} 



Por lo tanto, la esperanza de C = $2. 

Pr{4,6 y C pierdan y D gane} = Pr {ÁBCD} 

= Pr{^} Px{B\Á] Pr{C\ÁB} Pr{D\ÁBC } 



Por lo tanto, la esperanza de D = $1. 

C omprobación: $4 + $3 + $2 + $1 = $10 y § + ^ + A + i = 1. 


1 

5 


PERMUTACIONES 

6.17 ¿De cuántas maneras se pueden acomodar en línea 5 canicas de colores diferentes? 

SOLUCIÓN 

Hay que ordenar las cinco canicas en cinco posiciones:-. La primera posición puede ser ocupada por cualquiera 

de las 5 canicas (es decir, hay 5 maneras de ocupar la primera posición). Hecho esto, hay 4 maneras de ocupar la segunda 
posición; a continuación hay 3 maneras de ocupar la tercera posición; 2 maneras de ocupar la cuarta posición y, por último, 
sólo una manera de ocupar la última posición. Por lo tanto: 

Número de maneras en que se pueden colocar las cinco canicas en línea = 5 • 4 • 3 ■ 2 ■ 1 = 5! = 120 

En general, 

Número de maneras en las que se pueden colocar n objetos diferentes en línea = n(n - 1 )(n — 2) ■ • -1 = n! 

A esto se le conoce como el número de permutaciones de n objetos diferentes tomados de n en n y se denota „P„. 

6.18 ¿De cuántas maneras se pueden sentar 10 personasen una banca en la que sólo hay 4 asientos disponibles? 

SOLUCIÓN 

Hay 10 maneras de ocupar el primer asiento; hecho esto, hay 9 maneras de ocupar el segundo asiento; 8 maneras de ocupar 
el tercer asiento, y 7 maneras de ocupar el cuarto asiento. Por lo tanto: 

Número de ordenaciones de 10 personas tomadas de 4 en 4 = 10 ■ 9 ■ 8 • 7 = 5 040 


En general, 


Número de ordenaciones den objetos diferentes tomados der en r = n(n — 1) - - ■ (n — r + 1) 




Problemas resueltos 157 


A esto también se le conoce como el número de permutaciones de n objetos diferentes tomados de r en r y se denota n P r , 
P(n, r) o P nr Obsérvese que cuando r = n, „P„ = n!, como en el problema 6.17. 


6.19 Evaluar: a) 8 P 3 , b) 6 P 4 , c) 15 Pj y 3 P 3 , y e) los incisos del a) al d) empleando EXCEL. 

SOLUCIÓN 

a) 8 P 3 = 8 ■ 7 ■ 6 = 336, b) 6 P 4 = 6 ■ 5 ■ 4 ■ 3 = 360, c) 1 ^ > 1 = 15, y d) 3 P 3 = 3 ■ 2 ■ 1 = 6 
e) =PERM UTACIONES(8, 3) = 336 =PERM LITACIONES(6, 4) = 360 

=PERM LITACION ES(15,1) = 15 =PERM UTACION ES(3, 3) = 6 

6.20 Se desea sentar en hilera a 5 hombres y 4 mujeres de manera que las mujeres ocupen los lugares pares. ¿De 
cuántas maneras es posible hacer esto? 

SOLUCIÓN 

Los hombres se pueden sentar de 5 P 5 maneras y las mujeres de 4 P 4 maneras. A cada acomodo de los hombres se le puede 
hacer corresponder un acomodo de las mujeres. Por lo tanto, la cantidad de acomodos es 5 P 5 ■ 4 P 4 = 514! = (120)(24) = 
2 880. 

6.21 ¿Cuántos números de cuatro dígitos se pueden formar con los 10 dígitos 0, 1, 2, 3,..., 9, si: a) puede haber 
repeticiones, b ) no puede haber repeticiones y c) no puede haber repeticiones y el último dígito debe ser 
cero? 

SOLUCIÓN 

a) El primer dígito puede ser cualquiera de 9 dígitos (ya que no puede ser 0). El segundo, tercero y cuarto dígitos pueden 
ser uno cualquiera de 10. Entonces, se pueden formar 9 • 10 ■ 10 ■ 10 = 9 000 números. 

b) El primer dígito puede ser cualquiera de 9 dígitos (cualquiera menos el 0). 

El segundo dígito puede ser cualquiera de 9 dígitos (cualquiera menos el usado como primer dígito). 

El tercer dígito puede ser cualquiera de 8 dígitos (cualquiera menos los usados como los dos primeros dígitos). 

El cuarto dígito puede ser cualquiera de 7 dígitos (cualquiera menos los usados como los primeros tres dígitos). 

De manera que se pueden formar 9 • 9 • 8 ■ 7 = 4 536 números. 

Otro método 

El primer dígito puede ser uno cualquiera de 9 dígitos y los tres restantes se pueden escoger de g P 3 maneras. Por lo 
tanto, se pueden formar 9 ■ 9 P 3 = 9 ■ 9 • 8 ■ 7 = 4 536 números. 

c) El primer dígito se puede formar de 9 maneras, el segundo de 8 maneras y el tercero de 7 maneras. Por lo tanto, se 
pueden formar 9 • 8 • 7 = 504 números. 

Otro método 

El primer dígito se puede formar de 9 maneras y los siguientes dos dígitos en 9 P 2 maneras. Por lo tanto, se pueden 
encontrar 9 • 8 P 2 = 9 • 8 ■ 7 = 504 números. 

6.22 En un librero se van a acomodar cuatro libros diferentes de matemáticas, 6 libros diferentes de física y 2 libros 
diferentes de química. ¿Cuántos son los acomodos posibles si: a) los libros de cada materia tienen que estar 
juntos y b) sólo los libros de matemáticas tienen que estar juntos? 

SOLUCIÓN 

a) Los libros de matemáticas se pueden ordenar entre ellos de 4 P 4 = 4! maneras, los libros de física de 6 P 6 = 6! maneras, 
los libros de química de 2 P 2 = 2! maneras y los tres grupos de 3 P 3 = 3! maneras. Por lo tanto, el número de acomodos 
que se busca es = 4! 6! 2! 3! = 207 360. 
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b ) Considere a los 4 libros de matemáticas como un solo libro. Entonces se tienen 9 libros que se pueden acomodar 

de 9 P g = 9! maneras. En todas estas maneras, los libros de matemáticas están juntos. Pero los libros de matemáticas, 
entre ellos, se pueden acomodar de 4 P 4 = 4! maneras. Por lo tanto, el número de acomodos buscado es = 9! 4! = 
8 709 120. 

6.23 Cinco canicas rojas, 2 canicas blancas y 3 azules están ordenadas en línea. SI las canicas de un mismo color no 
se distinguen unas de otras, ¿cuántas ordenaciones distintas se pueden tener? Para evaluar esta expresión usar 
la función de EXCEL definida como =M U LTINOM IAL. 

SOLUCIÓN 

Supóngase que existen P ordenaciones diferentes. M ultipllcandoP por el número de maneras en las que se pueden ordenar: 
a) las 5 canicas rojas entre sí, b ) las 2 canicas blancas entre sí y c) las 3 canicas azules entre sí (es decir, multiplicando P 
por 5! 2! 3!), se obtiene el número de maneras en que se pueden ordenar las 10 canicas si son distinguibles (es decir, 10!). 
Por lo tanto, 

(5! 2! 3! )P = 10! y P = ^ 

En general, el número de ordenaciones den objetos de los cuales n 1 son ¡guales, n 2 son iguales,..., n k son ¡guales es 

ni 

n¡\n 2 l ■ ■ ■ n k \ 

donde n 1 + r 2 H- hn k = n. 

Con la función de EXCEL definida como =M U LTINOM IAL(5,2,3) se obtiene 2 520. 

6.24 ¿De cuántas maneras pueden sentarse 7 personas a una mesa redonda si: a) las 7 se pueden sentar en cualquier 
lugar y ó) 2 determinadas personas no pueden sentarse juntas? 

SOLUCIÓN 

a) Se escoge una de las personas para sentarla en cualquier lugar. Entonces, las 6 personas restantes se pueden sentar de 
6! = 720 maneras, que es el total de maneras de acomodar a 7 personas en una mesa redonda. 

b) Considérese como una sola persona a las dos personas que no se pueden sentar juntas. Entonces, quedan 6 personas 
en total que se pueden acomodar de 5! maneras. Pero las dos personas consideradas como una sola, entre ellas, se 
pueden acomodar de 2! maneras. Por lo tanto, la cantidad de maneras en que se pueden acomodar 6 personas en una 
mesa redonda sentando 2 personas juntas es 5!2! = 240. 

Entonces, empleando el Inciso a), el total de maneras en las que 7 personas se pueden sentar a una mesa redon¬ 
da, de manera que 2 determinadas personas no se sienten juntas = 720 - 240 = 480 maneras. 


COM BINACIONES 


6.25 ¿Decuántas maneras pueden colocarse 10 objetasen dos grupos, uno de4 y otro de6 objetos? 

SOLUCIÓN 


Esto es lo mismo que el número de ordenaciones de 10 objetos de los cuales 4 son ¡guales entre sí y 6 son ¡guales entre sí. 
De acuerdo con el problema 6.23, esto es 


10 ! 

4!6! 


10-9- 8- 7 
4! 


= 210 


Este problema es equivalente a hallar de cuántas maneras se pueden tomar 4 de 10 objetos (o bien 6 de 10 objetos) 
sin importar el orden. 

En general, el número de maneras en que se pueden seleccionar r de n objetos, a lo que se le llama el número de 
combinaciones de n cosas tomadas de r en r, se denota (”) y está dado por 



n\ 

r\(n — r)! 


! - 1) ■■■(« — r+ 1) 


p 

n 1 r 

7T 


/•! 
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6.26 Evaluar: a) Q, b) (®), c) (*) y d) evaluar los Incisos del a) al c) empleando EXCEL. 


SOLUCIÓN 

a) 

b ) 



6 ! 

5ÍTT 


A _ 7! _ 7-6-5-4 
4/ 413! 4! 

6 ■ 5 ■ 4 ■ 3 ■ 2 „ 


_ 7 - 6 - 5 
“3-2-1 

o bien 


= 35 




= 6 


c) Cj) es el número de maneras en que se pueden tomar todos los cuatro objetos, y sólo hay una manera, por lo que (j¡) 
= 1. Obsérvese que formal mente 



4! 

4!0! 


= 1 


si definimos 0! = 1. 

d) =COM BIN(7, 4) da 35, =COM BIN(6, 5) da 6 y =COM BIN(4, 4) da 1. 


6.27 ¿De cuántas maneras puede formarse de un grupo de 9 personas un comité de 5 personas? 

SOLUCIÓN 

9\ 9! 9-8-7-6-5 

5/ “ 5Í4Í “ 5! “ ' 

6.28 Con 5 matemáticos y 7 físicos hay que formar un comité que conste de 2 matemáticos y 3 físicos. ¿De cuántas 
maneras se puede formar este comité si: a) puede Incluirse a cualquiera de los matemáticos y a cualquiera de 
los físicos, b) hay uno de los físicos que tiene que formar parte del comité y c) hay dos de los matemáticos que 
no pueden formar parte del comité? 


SOLUCIÓN 

a) Dos matemáticos de5 se pueden seleccionar de(|) formas y 3 físicos de 7 se pueden seleccionar deQformas. Así que 
las maneras en que se puede seleccionar el comité son 

10-35 = 350 

b ) Dos matemáticos de 5 se pueden seleccionar de@ maneras y 2 físicos de 6 se pueden seleccionar de(®) maneras. Así 
que las maneras en que se puede seleccionar el comité son 

©C)- 1015=150 

c) Dos matemáticos de 3 se pueden seleccionar de(j) maneras y 3 físicos de 7 se pueden seleccionar de (3) maneras. Así 
que las maneras en que se puede seleccionar el comité son 

2) (D = 3 35= 105 

6.29 Una niña tiene 5 flores que son todas distintas. ¿Cuántos ramos puede formar? 


SOLUCIÓN 


Cada flor puede tratarse de dos maneras; puede ser elegida para el ramo o puede no ser elegida para el ramo. Como a cada 
una de estas dos maneras de tratar a la flor le corresponden 2 maneras de tratar a cada una de las otras flores, el número de 
maneras en que se puede tratar a las 5 flores es = 2 5 . Pero estas 2 5 maneras comprenden el caso en que no se elija ninguna 
de las flores. Por lo tanto, la cantidad de ramos que pueden formarse es = 2 5 - 1 = 31. 
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Otro método 

La niña puede elegir 1 de 5 flores, 2 de 5 flores,..., 5 de 5 flores. Por lo tanto, el número de ramos que puede formar es 



= 5 + 10+ 10 + 5 + 1 = 31 


E n general, para todo número entero positivo n, 



= 2 " - 1 


6.30 Con 7 consonantes y 5 vocales ¿cuántas palabras con 4 consonantes distintas y 3 vocales distintas pueden 
formarse? No Importa que las palabras no tengan significado. 


SOLUCIÓN 


Las cuatro consonantes distintas pueden elegirse de© maneras, las tres vocales distintas pueden elegirse de© maneras, y 
estas 7 letras (4 consonantes y 3 vocales) pueden ordenarse de 7 P 7 = 7! maneras. Por lo tanto, el número de palabras es 




•7! = 35-10 -5 040 = 1 764 000 


APROXIMACIÓN DE STIRLING PARA ni 

6.31 Evaluar 50! 

SOLUCIÓN 

Cuando n es grande se tiene n\ « s/lmirí' e~"; por lo tanto, 

50! rs ©2 tt( 50)50 50 e~ 50 = S 
Para evaluar S se usan logaritmos base 10. Por lo tanto, 

log S = log (©TÓO^SO 50 e“ 50 ) = i log 100 + i log 7T + 50 log 50 - 50 log e 

= ilog 100 +i log 3.142+ 50 log 50 - 50 log 2.718 
= 1 (2) + i (0.4972) + 50( 1.6990) - 50(0.4343) = 64.4846 

de lo que se encuentra que S = 3.05 x 10 64 , número que tiene 65 dígitos. 


PROBABILIDAD Y ANÁLISIS COM BINATORIO 

6.32 Una caja contiene 8 pelotas rojas, 3 blancas y 9 azules. Si se extraen 3 pelotas en forma aleatoria, determinar 
la probabilidad deque: a) las 3 sean rojas, b) las 3 sean blancas, c) 2 sean rojas y 1 sea blanca, d) por lo menos 
1 sea blanca, e) se extraiga una de cada colory f) se extraigan en el orden roja, blanca, azul. 

SOLUCIÓN 

a) Primer método 

Sean R 1; R 2 y R 3 los eventos "pelota roja en la primera extracción", "pelota roja en la segunda extracción", "pelota roja 
en la tercera extracción", respectivamente. Entonces R 1 R 2 R 3 denota el evento de que las tres pelotas extraídas sean 
rojas. 


Pr{*,* 2 Ü 3 } = Pr{7t,} Pr{fc|7?,} Pr^l^} = QQ ^ 
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Segundo método 


Probabilidad buscada = 


maneras de seleccionar 3 de 8 pelotas rojas 
maneras de seleccionar 3 de 20 pelotas 



14 

285 


b ) Empleando el segundo método del inciso a), 


Pr{las 3 sean blancas} 



1 

1 140 


También se puede usar el primer método del inciso a) 


c) Pr{2 sean rojas y 1 sea blanca} 


maneras de seleccionar \ /maneras de seleccionar 
2 de 8 pelotas rojas / \ 1 de 3 pelotas blancas 
maneras de seleccionar 3 de 20 pelotas 



7 

95 


d) Pr (ninguna sea blanca} 



de manera que 


Pr{por lo menos 1 sea blanca} = 1 


34 _ 23 
57 “57 


e) Pr{l de cada color} 



18 

95 


f) Empleando el inciso e), 


Pr (extraer las pelotas en el orden rojo, blanco, azul} 


1 

3! 


Pr(l de cada color} 


3 

95 


Otro método 


Pr(R,W 2 B 2 } = Pr(Ri} Pr(W 2 |Ri} Pr(B 3 !R,W 2 } = ^ (^j = ¿ 

6.33 De una baraja de 52 cartas bien barajadas se extraen 5 cartas. Encontrar la probabilidad deque: a) 4 sean ases; 
b) 4 sean ases y 1 sea rey; c) 3 sean dieces y 2 sean sotas; d) sean 9, 10, sota, reina y rey en cualquier orden; 
e) 3 sean de un palo y 2 de otro palo, y f) se obtenga por lo menos 1 as. 

SOLUCIÓN 


a) 


Pr{4 ases} 




1 

54 145 


1 


b ) 


Pr{4 ases y 1 rey} 


' 4 ' 


'52' 


649 740 
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0 


d) 


Pr {3 sean dieces y 2 sean sotas} 



1 

108 290 


Prjsean 9, 10, sota, reina y rey en cualquier orden} 



64 

162 435 


e) Como hay 4 maneras de elegir el primer palo y 3 maneras de elegir el segundo palo, 


Pr{3 sean de un palo y 2 de otro palo} 



^52 j 4 165 


f) 


Pr (ningún as} 


H 

V 5 J _ 35 673 
^52^ “ 54 145 


„ , , , , , 35 673 18 482 

y Pr \ por lo menos 1 as 1 = 1-=- 

y J 54 145 54 145 


6.34 Determinar la probabilidad detener 3 seises en cinco lanzamientos de un dado. 

SOLUCIÓN 


Los lanzamientos del dado se representarán por 5 espacios:-. En cada espacio se tendrá el evento 6 o el evento 

no -6 ( 6 ); por ejemplo se pueden tener tres 6 y dos no -6 en esta forma 6 6 6 6 6 o en esta forma 6 6 6 6 6 , etcétera. 

Ahora la probabilidad de un evento, como, por ejemplo, 6 6 6 6 6 es 


Pr {6 6 6 6 6 } = Pr{ 6 }Pr{ 6 } Pr{ 6 } Pr{ 6 } Pr{ 6 } 


115 15 
6 6 6 6 6 




2 


De igual manera, Pr {6 6666 } = (¿) 3 © 2 , etc., para todos los eventos en los que hay tres 6 y dos no- 6 . Pero de estos even¬ 
tos hay ( 3 ) = 10 y estos eventos son mutuamente excluyentes; por lo tanto, la probabilidad buscada es 


Pr {6 6 6660666660 etc.} 




125 
3 888 


En general si q = Pr{E} y q = Pr{E}, entonces empleando el razonamiento anterior, la probabilidad de en N ensayos 
obtener exactamente X veces E es 


6.35 En una fábrica se encuentra que en promedio 20% de los tornillos producidos con una máquina están defectuo¬ 
sos. Si se toman aleatoriamente 10 tornillos producidos con esta máquina en un día, encontrar la probabilidad 
de que: a) exactamente 2 estén defectuosos, b) 2 o más estén defectuosos y c) más de 5 estén defectuosos. 


SOLUCIÓN 


a) Empleando un razonamiento similar al empleado en el problema 6.34, 

Pr{2 tomillos defectuosos} = (0.2) 2 (0.8) 8 = 45(0.04)(0.1678) = 0.3020 

b ) Pr{2 o más tornillos defectuosos} = 1 Pr{0 tornillos defectuosos} - Pr{l tornillo defectuoso} 

= 1 - ^ 0 °)( 0 . 2 ) 0 ( 0 . 8) 10 - ^( 0 . 2 ) I ( 0 . 8) 9 

= 1 - ( 0 . 8) 10 - 10 ( 0 . 2 )( 0 . 8) 9 
= 1 - 0.1074 - 0.2684 = 0.6242 
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c) Pr{más de 5 tornillos defectuosos} = Pr{6 tomillos defectuosos} + Pr{7 tomillos defectuosos} 

+ Pr{8 tomillos defectuosos} + Pr{9 tomillos defectuosos} 

+ Pr{ 10 tomillos defectuosos} 

= ^ 6 °)( 0 . 2 ) 6 ( 0 . 8 ) 4 + ^ 7 °^( 0 . 2 ) 7 ( 0 . 8 ) 3 + ^( 0 . 2 ) s ( 0 . 8) 2 

+ ^( 0 . 2 ) 9 ( 0 . 8 )+^^( 0 . 2) 10 

= 0.00637 

6.36 Si en el problema 6.35 se tomaron 1 000 muestras de 10 tornillos cada una, ¿en cuántas de estas muestras se 
espera encontrar: a) exactamente 2 tornil los defectuosos, b) 2 o más tornil los defectuosos y c) más de 5 tornil los 
defectuosos? 

SOLUCIÓN 

a) La cantidad esperada es = (1 000)(0.3020) = 302, de acuerdo con el problema 6.35a). 

b ) La cantidad esperada es = (1 000)(0.6242) = 624, de acuerdo con el problema 6.35b). 

c) La cantidad esperada es = (1 000)(0.00637) = 6, de acuerdo con el problema 6.35c). 

DIAGRAMAS DE EULER O DE VENN Y PROBABILIDAD 

6.37 En la figura 6.11 se muestra cómo representar el espacio muestral de cuatro lanzamientos de una moneda y los 
eventos E 1 , obtener exactamente dos caras y dos cruces, y E 2 , obtener lo mismo en el primero y en el último 
lanzamiento. Ésta es una manera de representar diagramas de Venn y eventos en una hoja de cálculo. 
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Figura 6-11 EXCEL, representación del espacio muestral y de los eventos E x y E 2 - 

Debajo de E : se han marcado con una X los casos en los que se da el evento E 1 y debajo deE 2 se han 
marcado con una Y los casos en los que se da el evento E 2 . 

a) Dar los casos que pertenecen a E : n E 2 y E 1 u E 2 . 

b) Dar las probabilidades Pr^ n E 2 j y Pr^ u E 2 j. 

SOLUCIÓN 

a) Los casos que pertenecen aE x n E 2 son los que tienen X y Y. Por lo tanto, E 1 n E 2 consta de los casos htth y thht. Los 
casos que pertenecen aE 1 U E 2 son los que tienen X, Y oX y Y. Los casos que pertenecen aE 1 U E 2 son: hhhh, hhth, 
hhtt, hthh, htht, htth, thht, thth, thtt, tthh, ttht y tttt. 

b ) Pr{Ej n E 2 } = 2/16 = 1/8 o 0.125. Pr{Ej U E 2 } = 12/16 = 3/4 o 0.75. 
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6.38 Usando un espacio muestral y diagramas de Venn, mostrar que 

a) Pi{A U B} = Pr{A} + Pr{fi} - Pr{^ n B} 

b) Pr{A UfiUC} = Pr{A} + Pr{5} + Pr{C} - Pr {A n B} - Pr{B n C}- 
Pr{^nc} + Pr{/in J snc} 

SOLUCIÓN 

a) La unión no mutuamente excluyente A u B se puede expresar como la unión mutuamente excluyente de A rB, BnÁ, 
y A n B. 



Pr{A U B} = Pr {A n B) + Pr{5 n Áj + Pr{A n B} 

Ahora en el lado derecho de la ecuación se suma y se resta Pr{A n 6}. 

Pr {A U B} = Pr{A n B) + Pr{5 n Á} + Pr{A n B} + [Pr{A nfi}- Pr{y4 n 5}] 

Reordenando esta ecuación de la manera siguiente: 

Pr {A U B} = [Pr{^4 n¿) + Pr{^ n 5}] + [Pr{Z¿ ni} + Pr{A n 5}] - Pr {A n B} 

Pr {A U B} = Pr {A} + Pr{5} - Pr{A n B} 

b ) En la figura 6-13, el evento A está compuesto por las reglones 1, 2, 3 y 6, el evento B está compuesto por las reglones 

1, 3, 4 y 7, y el evento C está compuesto por las reglones 1, 2,4 y 5. 


8 







A 

6 


3 


7 

B 


2 

1 

4 






5 






C 





Figura 6-13 La unión no mutuamente excluyente de tres eventos, 4 UB UC. 

El espacio muestral de la figura 6-13 está formado por 8 regiones mutuamente excluyentes. Estas 8 regiones se 
describen como sigue: la región 1 esA n 6 n C, la región 2 esA n C n B, la región 3 esA n 6 n C, la región 4 es 
Á n C n B, la reglón 5 es Á n C n B, la región 6 es A n C n B, la región 7es^ncn6yla región 8 es Á n C 
n b. 

La probabilidad Pr{A U6 UCJse expresa como la probabilidad de las 7 regiones mutuamente excluyentes 
que forman A US u C, como sigue: 

Pr{A nsn c} + Pr {A n c ns} +Pr{A db n c} +Pr{A ncnfi} 

+ Pr{A ncn¿} + Pr{A ncnfi} +Pr{A nene} 
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Cada parte de esta ecuación puede reescribirse y toda completa simplificarse para obtener: 

Pr{A U B U C} = Pr{A} + Pr{5} + Pr{C} - Pr{^ n B} - Pr{5 nC} - Pr{^ nC} + Pr{^ nfinC} 
Por ejemplo, Pr{Á nCnfi) puede expresarse como 

Pr{C} - Pr{A n C} - Pr{BnC} + Pr{^ n fin C} 


6.39 En una entrevista a 500 adultos se les hizo una pregunta que constaba de tres partes: 1) ¿Tiene usted teléfono 
celular? 2) ¿Tiene un ¡pod? 3) ¿Tieneconexión a Internet? Los resultados se presentan a continuación (ningu¬ 
no contestó que no a todas las preguntas). 


Teléfono celular 

329 

teléfono celular e ¡pod 

83 

¡pod 

186 

teléfono celular y conexión a Internet 

217 

conexión a Internet 

295 

¡pod y conexión a Internet 

63 


Dar la probabilidad de los eventos siguientes: 

a) que conteste sí a todas las preguntas, b) que tenga teléfono celular, pero no conexión a Internet, c) que 
tenga ¡pod, pero no teléfono celular, d) que tenga conexión a Internet, pero no ¡pod e) que tenga teléfono 
celular o conexión a Internet pero no ¡pod y g) que tenga teléfono celular, pero no ¡pod o conexión a 
I nternet. 

SOLUCIÓN 

El evento A es que el entrevistado tenga teléfono celular, el eventos es que el entrevistado tenga ¡pod y el evento C es que 
el entrevistado tenga conexión a Internet. 


teléfono 

celular 


6 


3 


7 


2 

1 

4 



5 



ipod 


conexión a Internet 

Figura. 6-14 Diagrama deVen para ei problema 6.39. 


a) La probabilidad de que todos estén en la unión es 1, ya que ninguno respondió no a las tres partes. Pr{A US uC} 
está dada por la expresión siguiente: 

Pr {A} + Pr{5} + Pr{C} - Pr{^ nfi}-Pr{5 n C} - Pr{A nC} + Pr{^ nfinC} 

1 = 329/500 + 186/500 + 295/500 - 83/500 - 63/500 - 217/500 + Pr{,4 n B n C} 

Despejando Pr{A n 6 n C}, se obtiene 1 - 447/500 o bien 53/500 = 0.106. 

A ntes de responder los demás incisos conviene llenar las regiones de la figura 6-14, como se muestra en la figura 6-15. 
La cantidad correspondiente a la región 2 es la cantidad en la reglón A n C menos la cantidad en la región 1 o bien 
217 - 53 = 164. La cantidad correspondiente a la región 3 es la cantidad en la región A n 6 menos la cantidad en la 
región 1 o bien 83 - 53 = 30. La cantidad en la reglón 4 es la cantidad correspondiente a la región 6 n C menos el 
número en la región 1 o bien 63 - 53 = 10. La cantidad correspondiente a la región 5 es la cantidad en la región C 
menos la cantidad en las regiones 1, 2 y 4 o bien 295 - 53 - 164 - 10 = 68. La cantidad correspondiente a la región 
6 es la cantidad en la reglón A menos la cantidad en las regiones 1, 2 y 3 o bien 329 - 53 - 164 - 30 = 82. La can¬ 
tidad correspondiente a la reglón 7 es 186 - 53 - 30 - 10 = 93. 












166 Capítulo 6 Teoría elemental de la probabilidad 


8 

Teléfono 

celular 


2 i 4 


5 


conexión a Internet 


ipod 


Región 

número 

i 

53 

2 

164 

3 

30 

4 

10 

5 

68 

6 

82 

7 

93 

Total 

500 


Figura 6-15 A,B y C divididas en regiones mutuamente excluyentes. 


b ) regiones 3 y 6 o bien 30 + 82 = 112 y la probabilidad es 112/500 = 0.224. 

c) regiones 4 y 7 o bien 10 + 93 = 103 y la probabilidad es 103/500 = 0.206. 

cf) regiones 2 y 5 o bien 164 + 68 = 232 y la probabilidad es 232/500 = 0.464. 

e) regiones 2, 5 o bien 6 o bien 164 + 82 = 314 y la probabilidad es 314/500 = 0.628. 

f) región 6 u 82 y la probabilidad es 82/500 = 0.164. 


PROBLEMAS SUPLEMENTARIOS 

REGLAS FUNDAMENTALES DE LA PROBABILIDAD 

6.40 Determinar o estimar la probabilidad p de cada uno de los eventos siguientes: 

a) Al extraer de una baraja bien barajada una sola carta, obtener rey, as, sota de tréboles o rey de diamantes. 

b ) Se lanzan dos dados, una sola vez, y la suma de los puntos que aparecen en ellos resulte 8. 

c) Encontrar un tornillo que no esté defectuoso si de 600 tornillos examinados, 12 estuvieron defectuosos. 

d ) Se lanzan dos dados una vez y la suma de los puntos resulte 7 u 11. 

e) AI lanzar tres veces una moneda obtener cara por lo menos una vez. 

6.41 U n experimento consiste en extraer sucesivamente tres cartas de una baraja bien barajada. Sea E x el evento “rey" en la 
primera extracción, E 2 el evento "rey" en la segunda extracción y E 3 el evento "rey" en la tercera extracción. Exprese en 
palabras el significado de: 

a) Pi'{ElE 2 } c) E[ + E 2 e) E¡E 2 E 3 

b) Pr{E 1 + E 2 } d) Pr{E 3 |E,E 2 } f) Pr {E,E 2 + E 2 E 3 } 

6.42 De una caja que contiene 10 canicas rojas, 30 blancas, 20 azules y 15 anaranjadas, se extrae una canica. Hallar la probabi¬ 
lidad de que la canica extraída sea: a) anaranjada o roja, b) ni azul ni roja, c) no azul, cf) blanca y e) roja, blanca o azul. 

6.43 De la caja del problema 6.42 se extraen sucesivamente dos canicas, devolviendo a la caja cada canica después de extraída. 
Encontrar la probabilidad de que: a) las dos sean blancas, b) la primera sea roja y la segunda sea blanca, c) ninguna sea 
anaranjada, cf) sean rojas o blancas o las dos cosas (roja y blanca), e) la segunda no sea azul, f) la primera sea anaranjada, 

g) por lo menos una sea azul, h ) cuando mucho una sea roja, /) la primera sea blanca, pero la segunda no, y f) sólo una sea 
roja. 
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6.44 Repetir el problema 6.43, pero suponiendo que una vez extraídas las canicas no se devuelven a la caja. 

6.45 Encontrar la probabilidad de que al lanzar dos veces dos dados los puntos que se obtengan sumen 7: a) en el primer lanza¬ 

miento, b ) en uno de los dos lanzamientos y c) en los dos lanzamientos. 

6.46 De una baraja de 52 cartas, bien barajada, se extraen sucesivamente dos cartas. Encontrar la probabilidad de que: a) la 

primera carta extraída no sea un 10 de tréboles o un as, b) la primera carta sea un as, pero la segunda no, c) por lo menos 

una de las cartas sea un diamante, cf) las cartas no sean de un mismo palo, e) no más de una de las cartas sea una figura 
(sota, reina o rey), f) la segunda carta no sea una figura, y g) la segunda carta no sea una figura dado que la primera sí fue 
una figura, h) las cartas sean figuras o espadas o ambas. 

6.47 U na caja contiene papelillos numerados del 1 al 9. Si se extraen 3 papelillos de uno en uno, encontrar la probabilidad de 
que tengan números: 1) non, par, non o 2) par, non, par. 

6.48 Las oportunidades de que A gane un partido de ajedrez contra 6 son 3:2. Si se van a jugar 3 partidos, ¿cuáles son las posi¬ 
bilidades: a) a favor de que4 gane por lo menos dos de los tres partidos y b) en contra de que4 pierda los dos primeros 
partidos contra 6? 

6.49 En un monedero hay dos monedas de plata y dos monedas de cobre, en otro monedero hay cuatro monedas de plata y 3 
monedas de cobre. Si se toma al azar una moneda de uno de los dos monederos, ¿cuál es la probabilidad de que sea una 
moneda de plata? 

6.50 La probabilidad de que en 25 años un hombre esté vivo es f y la probabilidad de que en 25 años su esposa esté viva es §. 
Encontrar la probabilidad de que en 25 años: a) ambos estén vivos, b) sólo el hombre esté vivo, c) sólo la esposa esté viva 
y d ) por lo menos uno esté vivo. 

6.51 De 800 familias con cuatro hijos cada una, ¿qué porcentaje se espera que tenga: a) 2 niños y 2 niñas, b ) por lo menos 1 
niño, c) ninguna niña y d) cuando mucho 2 niñas? Supóngase que la probabilidad de niño y de niña es la misma. 


DISTRIBUCIONES DE PROBABILIDAD 

6.52 Si X es la variable aleatoria que indica la cantidad de niños en una familia con 4 hijos (ver problema 6.51): a) construir 
una tabla que dé la distribución de probabilidad deX y b) representar gráficamente la distribución de probabilidad del 
inciso a). 

6.53 U na variable aleatoria continua que toma valores sólo entre X = 2 y X = 8, inclusive, tiene una función de densidad dada 
por a(X + 3), donde a es una constante, a) Calcular a. Hallar ib) Pr{3 < X < 5}, c) Pr{X > 4} y cf) Pr{| X - 5| < 0.5}. 

6.54 De una urna que contiene 4 canicas rojas y 6 blancas se extraen 3 canicas sin reemplazo. Si X es la variable aleatoria que 
indica la cantidad de canicas rojas extraídas: a) construir una tabla que muestre la distribución de probabilidad deX, y 
b ) graficar la distribución. 

6.55 a) Se lanzan 3 dados y X = la suma de las tres caras que caen hacia arriba. Dar la distribución de probabilidad deX. 
b ) Encontrar Pr{7<X < 11}. 

ESPERANZA MATEMÁTICA 

6.56 ¿Cuál es el precio justo a pagar en un juego en el que se pueden ganar $25 con probabilidad 0.2 y $10 con probabili¬ 
dad 0.4? 
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6.57 Si llueve, un vendedor de paraguas gana $30 diarios. Si no, pierde $6 diarios. ¿Cuál es la esperanza si la probabilidad de 
que llueva es 0.3? 

6.58 A y 6 juegan un partido en el que lanzan una moneda 3 veces. El primero que obtiene cara, gana el partido. Si A lanza 
primero la moneda y si el valor total de las apuestas es $20, ¿con cuánto deberá contribuir cada uno para que el juego sea 
justo? 

6.59 Dada la distribución de probabilidad de la tabla 6.4, hallar: a) E (X), b ) E (X 2 ), c) E[(X - X) 2 ], d) E (X 3 ). 


Tabla 6.4 


X 

-10 

-20 

30 

p(*) 

1/5 

3/10 

1/2 


6.60 Dados los datos del problema 6.54, encontrar: a) la media, b ) la varianza y c) la desviación estándar de la distribución de 
X e Interpretar los resultados. 

6.61 U na variable aleatoria toma el valor 1 con probabilidad p y el valor 0 con probabilidad q = 1 - p. Probar que: a)E(X)=p 
y b) E[(X - X) 2 ] = pq. 

6.62 Probar que: a) E (2X + 3) = 2E (X) + 3 y b) E[{X - X ) 2 ] = E{X 2 ) - [E{X)] 2 . 

6.63 En el problema 6.55, encontrar el valor esperado deX. 

PERMUTACIONES 

6.64 Evalar: a) 4 P 2 , b ) 7 P 5 , y c) 10 P 3 . Dar la función de EXCEL para evaluar los incisos a), b ) y c). 

6.65 ¿Para qué valores den es n+1 P 3 = „P 4 ? 

6.66 ¿De cuántas maneras se pueden sentar 5 personas en un sofá si el sofá sólo tiene 3 asientos? 

6.67 ¿De cuántas maneras pueden ordenarse 7 libros en un librero si: a) pueden ordenarse como se desee, b) hay 3 libros que 

deben estar juntos y c) hay 2 libros que deben estar al final? 

6.68 ¿Cuántos números de cinco dígitos diferentes pueden formarse con los dígitos 1, 2, 3,..., 9 si: a) el número debe ser non 
y b ) si los dos primeros dígitos de cada número tienen que ser pares? 

6.69 Resolver el problema 6.68 si se permiten dígitos repetidos. 

6.70 ¿Cuántos números de tres dígitos pueden formarse con tres 4, cuatro 2 y dos 3? 


6.71 ¿De cuántas maneras pueden sentarse a una mesa redonda 3 hombres y 3 mujeres si: a) sin ninguna restricción, b) hay dos 
mujeres que no pueden sentarse juntas y c) cada mujer debe estar entre dos hombres? 
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COMBINACIONES 


6.72 Evaluar: a) r Y b) K jy c) í „). Dar la función de EXCEL para evaluar los incisos a), b) y c). 


6.73 ¿Para qué valores de n se cumple que: 3 ( " + 1 'j =7 Q)? 


6.74 ¿De cuántas maneras se pueden seleccionar 6 de 10 preguntas? 

6.75 ¿Cuántos comités de 3 hombres y 4 mujeres pueden formarse a partir de un grupo de 8 hombres y 6 mujeres? 

6.76 ¿De cuántas maneras pueden seleccionarse 2 hombres, 4 mujeres, 3 niños y 3 niñas de un grupo de 6 hombres, 8 mujeres, 
4 niños y 5 niñas si: a) no hay ninguna restricción y b ) hay un hombre y una mujer que tienen que seleccionarse? 

6.77 ¿De cuántas maneras puede dividirse un grupo de 10 personas en: a) dos grupos de 7 y 3 personas y ib) tres grupos de 4, 3, 

y 2 personas? 

6.78 A partir de 5 profesionales de la estadística y 6 economistas, se va a formar un grupo que conste de 3 profesionales de la 
estadística y 2 economistas. ¿Cuántos comités diferentes pueden formarse si: a) no hay restricción alguna, b) hay 2 profe¬ 
sionales de la estadística que deben estar en el comité y c) hay un economista que no puede formar parte del comité? 

6.79 Encontrar la cantidad de: a) combinaciones y b ) permutaciones de cuatro letras que pueden formarse con las letras de la 
palabra Tennessee. 


6.80 


Probar que 1 - Q + © -©+■ + (- 1)"Q - 0. 


APROXIMACION DE STIRLING PARA n! 

6.81 ¿De cuántas maneras se pueden seleccionar 30 individuos de un grupo de 100 individuos? 


6.82 M ostrar que para valores grandes de n ( “ ) = T"/y/ññ, aproximadamente. 


PROBLEMAS MISCELÁNEOS 

6.83 De una baraja de 52 cartas se extraen tres cartas. Encontrar la probabilidad deque: a) dos sean sotas y una sea rey, b) todas 
sean de un mismo palo, c) todas sean de palos diferentes y d) por lo menos dos sean ases. 

6.84 Encontrar la probabilidad de que de cuatro lanzamientos de un par de dados, por lo menos en dos se obtenga como suma 7. 

6.85 Si 10% de los remaches que produce una máquina están defectuosos, ¿cuál es la probabilidad deque de 5 remaches toma¬ 
dos al azar: a) ninguno esté defectuoso, b ) 1 esté defectuoso y c) por lo menos 2 estén defectuosos? 

6.86 a) Dar un espacio muestral para los resultados de 2 lanzamientos de una moneda empleando 1 para representar "cara" y 

0 para representar “cruz". 

b ) A partir de este espacio muestral, determinar la probabilidad de por lo menos una cara. 

c) ¿Se puede dar el espacio muestral para los resultados de tres lanzamientos de una moneda? Determinar con ayuda de 
este espacio muestral la probabilidad de cuando mucho dos caras. 
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6.87 En una encuesta realizada con 200 votantes, se obtuvo la información siguiente acerca de tres candidatos (/A, 6 y C) de un 
partido que competían por tres puestos diferentes: 

28 a favor de A y 6 122 a favor de 6 o C, pero no de .4 

98 a favor de A o B, pero no de C 64 a favor de C , pero no de A o B 

42 a favor de 6, pero no de A o C 14 a favor de A y C, pero no de 6 

¿Cuántos de los votantes estuvieron a favor de: a) los tres candidatos, b ) A sin tener en cuenta a 6 o C, c) 6 sin tener en 
cuenta a4 o C,d) C sin tener en cuenta a A o 6, e) A y 6, pero no deC, y f) sólo uno de los candidatos? 

6.88 a) Probar que para dos eventos E 1 y E 2 cualquiera, Pr{£, + £ 2 }<Pr{£ 1 } + Pr{£ 2 }. 

b ) Generalizar los resultados del inciso a). 


6.89 Sean E v E 2 y E 3 tres eventos diferentes y se sabe que por lo menos uno de ellos ha ocurrido. Supóngase que cualquiera de 
estos eventos tiene como resultado otro evento A, que también se sabe que ya ha ocurrido. Si todas las probabilidades 
Pr{Ej}, Pr{£ 2 }, Pr{£ 3 } y Pr{4 |Ej}, Pr{4 | £ 2 }, Pr{/A | £ 3 } se suponen conocidas, probar que 


Vr{E x \A} 


_Pr{£!}Pr{^|£i}_ 

Pr{£!} Pr{,4|£ 1 } + Pr{£ 2 } ?r{A\E 2 } + Pr{£ 3 } Pr{^|£ 3 } 


existiendo resultados similares para Pr{£ 2 | A} y Pr{£ 3 1 4}. Esto se conoce como regla o teorema de Bayes, y es útil para 
calcular las probabilidades de diversos E 1: E 2 y E 3 hipotéticos que han dado como resultado un evento A. Este resultado 
puede generalizarse. 


6.90 Se tienen tres joyeros idénticos con dos cajones cada uno. En cada cajón del primer joyero hay un reloj de oro. En cada 
cajón del segundo joyero hay un reloj de plata. En un cajón del tercer joyero hay un reloj de oro, y en el otro cajón hay un 
reloj de plata. Si se toma al azar uno de los joyeros, se abre uno de los cajones y se encuentra que contiene un reloj de plata, 
¿cuál es la probabilidad de que en el otro cajón se encuentre un reloj de oro? [ Sugerencia: Emplear el problema 6.89.] 


6.91 Encontrar la probabilidad de ganar en un sorteo en el que hay que elegir seis números, en cualquier orden, de entre los 
números 1, 2, 3,..., 40. 


6.92 Repetir el problema 6.91 si hay que escoger: a) cinco, b) cuatro y c) tres números. 

6.93 En un juego de póquer, a cada jugador se le dan cinco cartas de un juego de 52 naipes. Determinar las posibilidades en 
contra de que a un jugador le toque: 

a) U na flor Imperial (as, rey, reina, sota y 10 de un mismo palo). 

b ) U na corrida (5 cartas consecutivas y del mismo palo; por ejemplo, 3, 4, 5, 6 y 7 de espadas). 

c) Un póquer (por ejemplo 4 sietes). 

d) Un full (3 de un tipo y 2 de otro; por ejemplo, 3 reyes y 2 dieces). 

6.94 Ay B acuerdan encontrarse entre 3 y 4 delatardey también acuerdan que no esperarán al otro más de 10 minutos. Determinar 
la probabilidad de que se encuentren. 

6.95 En un segmento de recta de longitud a > 0 se seleccionan en forma aleatoria dos puntos. Encontrar la probabilidad de que 
los tres segmentos de recta que se forman puedan ser los lados de un triángulo. 

6.96 U n tetraedro regular consta de cuatro lados. Cada lado tiene la misma posibilidad de caer hacia abajo cuando el tetraedro 

es lanzado y vuelve al reposo. En cada uno de los lados hay uno de los números 1, 2, 3 o 4. Sobre una mesa se lanzan tres 

tetraedros regulares. SeaX la suma de las caras que caen hacia abajo. Dar la distribución de probabilidad deX. 

6.97 En el problema 6.96, encontrar el valor esperado deX. 
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6.98 En una encuesta realizada a un grupo de personas se encontró que 25% eran fumadoras y bebedoras, 10% eran fumadoras 
pero no bebedoras, y 33% eran bebedoras pero no fumadoras. ¿Qué porcentaje eran fumadoras o bebedoras o ambas 
cosas? 

6.99 A eme el ectronics fabrica M P3 en tres lugares. La fábrica situada en Omaha fabrica el 50% de los M P 3,1% de los cuales 
tienen algún defecto. La fábrica en Memphis fabrica el 30%, el 2% de éstos tienen algún defecto. La fábrica en Fort 
M eyers fabrica el 20% y el 3% de éstos tienen algún defecto. Si se toma al azar un M P3, ¿cuál es la probabilidad de que 
tenga algún defecto? 

6.100 Con respecto al problema 6.99: se encuentra un M P3 que tiene algún defecto, ¿cuál es la probabilidad de que haya sido 
fabricado en Fort M eyers? 


7 


Las distribuciones 

BINOMIAL, NORMAL 
Y DE POISSON 


LA DISTRIBUCIÓN BINOMIAL 

Si p es la probabilidad de que en un solo ensayo ocurra un evento (llamada la probabilidad de éxito) y q = 1 - p es la 
probabilidad de que este evento no ocurra en un solo ensayo (llamada probabilidad de fracaso), entonces la probabi¬ 
lidad de que el evento ocurra exactamenteX veces en N ensayos (es decir, que ocurran X éxitos y N -X fracasos) está 
dada por 


p{X) = 


P X <T- X 


N\ 


X! (N-X)! 


pV~ x 


dondeX = 0,1, 2. N; N\ =N(N - 1)(N — 2) - - -1; y 0! = 1 por definición (ver problema 6.34). 

EJEMPLO 1 La probabilidad de obtener exactamente dos caras en seis lanzamientos de una moneda es 

6\ m 2 /1\ 6 ~ 2 _ _ 6 _ /1 \ 6 _ 15 
2j \2j yñy _ 2Í4Í \2y ~ 64 


( 1 ) 


empleando la fórmula (1) con N = 6, X ** 2 y p = q = 

Usando EXCEL, la evaluación de la probabilidad de 2 caras en 6 lanzamientos se obtiene de la siguiente manera: 
=BINOM DIST(2,6,0,5,0), donde la función BINOM DIST tiene 4 parámetros. 

El primer parámetro es el número de éxitos, el segundo es el número de ensayos, el tercero es la probabilidad de éxito y el 
cuarto es 0 o 1. Cero da la probabilidad del número de éxitos y uno da la probabilidad acumulada. La función =BINOM DIST (2,6,0.5,0) 
da 0.234375 que es lo mismo que 15/64. 

EJEMPLO 2 La probabilidad de obtener por lo menos 4 caras en 6 lanzamientos de una moneda es 
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A la distribución de probabilidad discreta (1) suele llamársele di stribución binomial, debido a queaX = 0,1, 2,..., 
N le corresponden los términos sucesivos de la fórmula binomial o expansión binomial, 

{q+p) N = q» + [iy-'p + (")«”- V + ---+P* (2) 

donde 1, ( 1 ¡), (0),... se conocen como coeficientes binomial es. 

Empleando EXCEL, la solución es =l-BINOM D151(3,6,0.5,1) o 0.34375 que es lo mismo que 11/32. Como 
Pr{X > 4} = 1 - Pr{X < 3} y BINOM DIST(3,6,0.5,1) = Pr{X < 3}, este cálculo da la probabilidad de obtener por 
lo menos 4 caras. 

EJEMPLO 3 (q+p) 4 = q 4 + + QvV + Qffl» 3 +/ 

= q 4 + 4 q 3 p + 6 q 2 p 2 + Aqp 3, + p 4 


En la tabla 7.1 se enumeran algunas de las propiedades de las distribuciones blnomiales. 


Tabla 7.1 Distribución binomial 


M edia 

p = Np 

Varlanza 

a 2 = Npq 

Desviación estándar 

cr = y Npq 

Coeficiente momento de sesgo 

q-p 
° 3 y/Npq 

Coeficiente momento de curtosis 

1 - 6 pq 

a 4 ~ ^ + 

Npq 


EJEMPLO 4 En 100 lanzamientos de una moneda, el número medio de caras es p, = Np = (100)0 = 50; éste es el número 
esperado de caras en 100 lanzamientos de una moneda. La desviación estándar es a = y Npq = ^/(1OO)(10 = 5. 


LA DISTRIBUCIÓN NORMAL 


Uno de los ejemplos más importantes de di stribución de probabilidad continua es la distribución normal, curva normal 
o distribución gaussiana, que se define mediante la ecuación 


Y = 





(3) 


donde p, = media, a= desviación estándar, n = 3.14159-■ ■ y e = 2.71828 - - -. El total del área, que está limitada por 
la curva (3) y por el ejeX es 1; por lo tanto, el área bajo la curva comprendida entreX = a y X = b, donde a < b repre¬ 
senta la probabilidad dequeX se encuentre entre a y b. Esta probabilidad se denota por Pr{a < X < b}. 

SI la variableX se expresa en términos de unidades estándar [z = (X — p)/o\, en lugar de la ecuación (3) se tiene 
la llamada forma estándar: 


Y = 


1 


s/2tt 


e 


l/2z 2 


(4) 
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En estos casos se dice quez está distribuida normalmente y que tiene media Oyvarianza 1. En la figura 7-1 se presen¬ 
ta la gráfica de esta curva normal estándar; también se muestra que las áreas comprendidas entre z = -1 y z = + 1 , 
z = -2 y z = +2, y z= -3 y z = +3 son ¡guales, respectivamente, a 68.27%, 95.45% y 99.73% del área total, que es 
1. En la tabla que se presenta en el apéndice II se dan las áreas bajo esta curva entre z = 0 y cualquier valor positivo 
dez. Con ayuda de esta tabla se encuentra el área entre dos valores dez cualesquiera, empleando la simetría de la curva 
respecto a z = 0 . 

En la tabla 7.2 se enumeran algunas propiedades de la distribución normal dada por la ecuación (3). 


Figura 7-1 



-3-2-10 1 2 3 


C urva normal estándar: 68.27% del área está entrez = -1 y z = 1, 95.45% del área está entre 
2 = -2 yz = 2 y 99.73% del área estáentrez = -3yz = 3. 


Tabla 7.2 Distribución normal 


M edia 

A 

Varlanza 

2 

<7 

Desviación estándar 

(7 

Coeficiente momento de sesgo 

«3 = 0 

Coeficiente momento de curtosis 

«4 = 3 

Desviación media 

C t v / 27t = 0.7979a 


RELACIÓN ENTRE LAS DISTRIBUCIONES BINOM I AL Y NORMAL 

SI N es grande y si ni p ni <7 tienen valores muy cercanos a cero, la distribución binomial puede ser aproximada por 
una distribución normal con la variable estandarizada dada por 

_X-Np 

■/Ñpq 

A medida que crece N, la aproximación mejora y en el caso límite es exacta; esto se muestra en las tablas 7.1 y 7.2, de 
donde es claro que a medida que N aumenta, el sesgo y la curtosis de la distribución binomial se aproximan al sesgo 
y a la curtosis déla distribución normal. En la práctica, la aproximación es muy buena si tanto Np como Nq son mayo¬ 
res a 5. 
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EJEMPLO 5 En la figura 7-2 se muestra la distribución binomial correspondiente a N = 16 y p = 0.5, ilustrando las probabili¬ 
dades de obtener X caras en 16 lanzamientos de una moneda, así como la distribución normal con media 8 y desviación estándar 2. 
Obsérveselo semejante que son ambas distribuciones. X es binomial, con media = Np = 16(0.5) = 8 y desviación estándar y/Npq = 
y/16(0.5)(0.5) = 2. Y es una curva normal con media = 8 y desviación estándar 2. 
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p(X)*X 


f ( Y)*Y 

0.20 - 
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• • 
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0.10 - 



• • 


• • 

0.05 - 


0.05 - 



• • 


• • 


• • 



0.00 - 

• • • Binomial • • • 

0.00 - 

• • • N ormal • • • 


0 4 8 12 16 

Figura 7-2 Gráfica de una curva binomial correspondiente a W = 16 y p = 0.5 y una curva normal 

con media = 8 y desviación estándar = 2. 


LA DISTRIBUCIÓN DE POISSON 


La distribución de probabilidad discreta 




\ x e~ x 

X\ 


X= 0,1,2,... 


(5) 


donde e = 2.71828- ■ y A es una constante dada, se conoce como distribución de Poisson en honor a Siméon-Denis 
Poisson, quien la descubrió a comienzos del siglo xix. Los valores dep(X) pueden calcularse empleando la tabla del 
apéndice VIII (la cual da los valores dee~ A para diversos valores de A) o usando logaritmos. 


EJEMPLO 6 El número de personas por día que llegan a una sala de urgencias tiene una distribución de Poisson con media 5. 
Hallar la probabilidad de que cuando mucho lleguen tres personas por día y la probabilidad deque por lo menos lleguen 8 personas 
por día. La probabilidad de que cuando mucho lleguen 3 personas es Pr{X <3} = e _5 {5°/0! + 5V1! +5 2 /2! +5 3 /3!}. De acuerdo 
con el apéndice VIII, e 5 = 0.006738 y P r{X <3} = 0.006738{l + 5 +12.5 + 20.8333} = 0.265. Empleando M INITAB, la secuen¬ 
cia "Cale => Probability distribution => Poisson" da la caja de diálogo de la distribución de Poisson que se llena como se mues¬ 
tra en la figura 7-3. 

El resultado que se obtiene es el siguiente: 


Función de distribución acumulada 

Poisson wit h mean = 5 

x P(X<=x) 

3 0.265026 


El resultado es el mismo que el hallado usando el apéndice VIII. 
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La probabilidad de que lleguen por lo menos 8 personas por día es Pr{Z>8} = 1 -Pr{Z<7}. Empleando 
M INITAB se encuentra: 



Figura 7-3 M INITAB, cuadro de diálogo para la distribución de Poisson. 

Función de distribución acumulada 

Poisson wi t h mean = 5 
x P( X < = x) 

7 0.866628 

Pr{Z>8}= 1 -0.867 = 0.133. 

En la tabla 7.3 se enumeran algunas de las propiedades de la distribución de Poisson. 


Tabla 7.3 Distribución de Poisson 


M edia 

¡i = X 

Varianza 

er 2 = A 

Desviación estándar 

a = \/A 

Coeficiente momento de sesgo 

aj = 1 /VA 

Coeficiente momento decurtosis 

0 Í 4 — 3 + 1 / A 


RELACIÓN ENTRE LAS DISTRIBUCIONES BINOM IAL Y DE POISSON 

En la distribución binomial (1), si N es grande, pero la probabilidad p déla ocurrencia de un evento es cercana a 0, con 
lo queq = 1 - p es cercana 1, al evento se le llama evento raro. En la práctica se considera que un evento es raro si el 
número de ensayos es por lo menos 50 (N > 50) mientras que Np es menor a cinco. En tales casos la distribución bino¬ 
mial (1) se aproxima con la distribución de Poisson (5) con A = Np. Esto se comprueba comparando las tablas 7.1 y 
7.3, ya que sustituyendo A = Np, q «¡ 1 y p « 0 en la tabla 7.1 se obtienen los resultados de la tabla 7.3. 

Como existe una relación entre las distribuciones binomial y normal, también existe una relación entre las distri¬ 
buciones de Poisson y normal. En efecto, se puede demostrar que a medida que A aumenta indefinidamente, la dis¬ 
tribución de Poisson se aproxima a la distribución normal con variable estandarizada (X - A)/V% 
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LA DISTRIBUCIÓN MULTINOMIAL 


Si los eventos £ 1; E 2 ,...,E K pueden ocurrir con probabilidades p x , p 2 ,..., p K , respectivamente, entonces la probabili¬ 
dad dequeE^ E 2 ,..., E K ocurran X 1; X 2 ,...,X K veces, respectivamente, es 


N\ 


X, „X> 


X¡!X 2 l ■ ■ ■ X K \ Pl Pl 


x K 

■Pk 


( 6 ) 


donde X¡ + X 2 H-h X K = N. A esta distribución, que es una generalización de la distribución binomial, se le llama 

distribución muttinomiat debido a que la ecuación (6) es el término general en la expansión muitinomiat 

ÍP\ +Pi H- +Pk) N ■ 


EJEMPLO 7 Si un dado se lanza 12 veces, la probabilidad de obtener cada uno de los números 1, 2, 3,4, 5 y 6 exactamente dos 
veces es 


12 ! 

2!2!2!2!2!2! 



1 925 
559 872 


0.00344 


L os números esperados de veces que ocurrirán E 1 ,E 2 ,E K en N ensayos son Np 2 , Np 2 , ..., Np K , respectivamente. 

Para obtener este resultado se puede emplear EXCEL de la manera siguiente: se usan =M ULTINOM IAL(2,2,2,2,2,2) para 
evaluar 2 \ 2 ¿\ 2 \m\ ’ con 1 ° que se obtiene 7 484 400. Esto se divide después entre 6 12 , que es 2 176 782 336. El cociente es 0.00344. 


AJ USTE DE DISTRIBUCIONES DE FRECUENCIAS 
MUESTRALES M EDI ANTE DI STRI BUCION E S TEÓRIC AS 

Cuando por medio de un razonamiento probabilístico, o de alguna otra manera, se ti ene idea déla distribución de una 
población, tal distribución teórica (también llamada distribución modelo o esperada) puede ajustarse a distribuciones 
de frecuencias de una muestra obtenidas de una población. El método utilizado consiste, por lo general, en emplear la 
media y la desviación estándar de la muestra para estimar la media y la desviación estándar de la población (ver pro¬ 
blemas 7.31, 7.33 y 7.34). 

Para probar la bondad de ajuste de las distribuciones teóricas se usa la prueba ji-cuadrada (que se presenta en el 
capítulo 12). Cuando se quiere determinar si una distribución normal representa un buen ajuste para datos dados es 
conveniente emplear papel gráfico de curva normal, o papel gráfico de probabilidad, como se le suele llamar (ver 
problema 7.32). 


PROBLEMAS RESUELTOS 


LA DISTRIBUCIÓN BINOM IAL 
7.1 Evaluar las expresiones siguientes: 



SOLUCIÓN 


a) 5! = 5-4-3 -2- 1 = 120 

6! _ 6 ■ 5 ■ 4 ■ 3 ■ 2 ■ 1 _6-5 
' 2! 4! (2 - 1)(4 -3-2-1) 2-1 

/8\ _ 8! _ 8! _ 8-7-6-5-4-3-2-1 _8-7-6 

C) \3/ 31(8 — 3)1 3!~5! — (3 ■ 2 ■ 1)(5 - 4 - 3 - 2 - 1) ~ 3 - 2 - 1 
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H\ _ 7! _ 7-6-5-4-3-2-1 _7-6 
' \5y 5! 2! (5 ■ 4 - 3 • 2 -1)(2 ■ 1) 2-1 

/4\ 4' 

e) 11 = 4 , 01-1 ya que por definición, 0! = 1 


f) 



4! 

0!4! 


1 


7.2 Supóngase que 15% de la población es zurda. Encontrar la probabilidad de que en un grupo de 50 Individuos 
haya: a) cuando mucho 10 zurdos, b) por lo menos 5 zurdos, c) entre 3 y 6 zurdos y d) exactamente 5 zurdos. 
Usar EXCEL para hallar las soluciones. 

SOLUCIÓN 

a) La expresión de EXCEL =BINOM DIST(10,50,0.15,1) da Pr{X < 10} que es 0.8801. 

b ) Se pide hallar Pr{X > 5} que es igual al - Pr{X < 4}, yaqueX > 5 y X < 4 son eventos complementarios. La expresión 
de EXCEL para obtener el resultado buscado es =1-BINOM DIST(4,50,0.15,1), que da 0.8879. 

c) Se pide hallar Pr{3 <X < 6} que es igual a Pr{X < 6} - Pr{X < 2}. La expresión de EXCEL para obtener el resultado 
buscado es =BINOM DIST(6,50,0.15,1)-BINOM DIST(2,50,0.15,1) que proporciona 0.3471. 

d) La expresión de EXCEL =BINOM DIST(5,50,0.15,0) da Pr{X = 5} que da 0.1072. 


7.3 Hallar la probabilidad de que en cinco lanzamientos de un dado aparezca un 3: a) ninguna vez, b) una vez, 
c) dos veces, d) tres veces, e) cuatro veces, f) cinco veces y g) dar la solución empleando M INITAB. 


SOLUCIÓN 


La probabilidad de obtener un 3 en un solo lanzamiento = p = \ y la probabilidad de no obtener un 3 en un solo lanza¬ 
miento = q = 1 - p = §; por lo tanto: 


a) Pr{aparezca un 3 cero veces} = g) g) g) =W(l)g) 

b) Pr{aparezca un 3 una vez} = g) g) g) =(5)g)g) 


0 

d) 

e) 


Pr{aparezcaun 3 dos veces} = 
Pr{aparezca un 3 tres veces} = 
Pr{aparezca un 3 cuatro veces} 



625 
3 888 

125 
3 888 



25 

7 776 


f) Pr{aparezca un 3 cinco veces} 



1 

7 776 


Obsérvese que estas probabilidades corresponden a los términos de la expansión binomial 


H)- 





5 

= 1 


g) En la columna C1 se ingresan los enterados 0 a 5 y después se llena el cuadro de diálogo para la distribución binomial 
como se indica en la figura 7-4. 
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Figura 7-4 M INITAB, cuadro dediálogo para el problema 7.3 g). 


En la hoja de cálculo se obtiene el siguiente resultado: 

Cl C2 

0 0.401894 

1 0.401874 

2 0.160742 

3 0.032147 

4 0.003215 

5 0.000129 

M ostrar que las fracciones dadas en los Incisos a) a f) se transforman en los decimales que se obtienen con 
MI NITAB. 


Escribir la expansión blnomial dea) (q + p) 4 y deb) (q + p) 6 . 

SOLUCIÓN 

3 ) (q+ p ) 4 = q 4 + ^ q 3 p + Q ) ? V + Q) qp 3 + p 4 

= cf + 4q 3 p + 6 q 2 p 2 + 4qp 3 + p A 

b) (q +p) 6 = q 6 + q 5 p + ?V + q 3 p 3 + ^ q 2 p 4 + ^ qp 5 +/ 

= < 7 S + 6q 5 p + 15í/V 2 + 20 q 3 p l + 15 q 2 p 4 + 6 qp 5 + p 6 

Los coeficientes 1, 4, 6, 4, 1 y 1, 6,15, 20,15, 6,1 son los coeficientes binomiales correspondientes a N = 4 y N = 
6, respectivamente. Si se escriben estos coeficientes para N = 0, 1, 2, 3,..., como se muestra en la figura siguiente, se 
obtiene el llamado triángulo de Pascal. Obsérvese que en cada renglón el primero y el último número es un 1, y que cada 
número se obtiene sumando los números que se encuentran a la izquierda y a la derecha en el renglón superior. 
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1 

1 1 

1 2 1 
13 3 1 

1 4 6 4 1 

1 5 10 10 5 1 

1 6 15 20 15 6 1 


7.5 Encontrar la probabilidad de que en una familia con cuatro hijos haya: a) por lo menos un niño y b) por lo 
menos un niño y una niña. Supóngase que la probabilidad de que nazca un niño varón es 

SOLUCIÓN 

a\Vr 3 


a) Pr{l niño} . Q Q (}) - j Pr{3 niños) - Q Q Q) 


Pr{2 niños} = 


8 


Pr{4 niños} = 


1 

4 

1 

16 


Por lo tanto, 


Otro método 


Prjpor lo menos 1 niño} = Pr{l niño} + Pr{2 niños} + Pr{3 niños} + Pr{4 niños} 

_ 1 3 i 1 _ 15 

~4 + 8 + 4 + T6~T6 


Prjpor lo menos 1 niño} = 1 - Prjningún niño} = 1 - ( ^ ) = 1 - ^ 

1 1 _ 7 

16 16 8 


b) Prjpor lo menos 1 niño y 1 niña} = 1 - Pr{ningún niño} - Pr{ninguna niña} = 1 — 


7.6 De 2 000 familias con cuatro hijos cada una, ¿cuántas se esperaría que tuvieran: a) por lo menos un niño, 

b) dos niños, c) 1 o 2 niñas y d) ninguna niña? Consultar el problema 7.5a). 


SOLUCIÓN 

a) Número esperado de familias por lo menos con 1 niño = 2 000(j|) = 1 875 

b ) Número esperado de familias con 2 niños = 2 000 ■ Pr{2 niños} = 2 000(|) = 750 

c) Pr{l o 2 niñas} = Pr{l niña} + Pr{2 niñas} = Pr{l niño} + Pr{2 niños} = 1 + | = |. Número esperado de familias 

con 1 o 2 niñas = 2 000(|) = 1 250 

d) Número esperado de familias sin ninguna niña = 2 000(¿) = 125 


7.7 SI el 20% de los tornillos que se fabrican con una máquina están defectuosos, determinar la probabilidad de 
que de 4 tornillos elegidos al azar: a) 1 tornillo esté defectuoso, b) 0 tornillos estén defectuosos y c) cuando 
mucho 2 tornillos estén defectuosos. 


SOLUCIÓN 

La probabilidad de que un tornillo esté defectuoso es p = 0.2 y la probabilidad de que no esté defectuoso es q = 1 - p 
= 0 . 8 . 

a) Pr{l de 4 tornillos esté defectuoso} = (0.2)'(0.8) 3 = 0.4096 
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b ) Pr{0 tornillos estén defectuosos} = Qj (0.2)°(0.8) 4 = 0.4096 

c) Pr{2 tornillos estén defectuosos} = Qj (0.2) 2 (0.8) 2 = 0.1536 
Por lo tanto 

Prjcuando mucho 2 tornillos estén defectuosos} = Pr{0 tornillos estén defectuosos} + Pr{l tornillo esté defectuoso} 

+ Pr{2 tornillos estén defectuosos} 

= 0.4096 + 0.4096 + 0.1536 = 0.9728 

La probabilidad deque un estudiante que entra a la universidad se titule es 0.4. Determinar la probabilidad de 
que de 5 estudiantes elegidos al azar: a) ninguno se titule, b) 1 se titule, c) por lo menos 1 se titule, d) todos se 
titulen y e) emplear STATISTIX para responder los Incisos a) a d). 

SOLUCIÓN 

a) Prjninguno se titule} = Qj (0.4)°(0.6) 5 = 0.07776 o aproximadamente 0.08 

b ) Pr{l se titule} = Qj(0.4)‘(0.6) 4 = 0.2592 o aproximadamente 0.26 

c) Prjpor lo menos 1 se titule} = 1 - Prjninguno se titule} = 0.92224 o aproximadamente 0.92 

d ) Prjtodos se titulen} = ^(0.4) 5 (0.6)° = 0.01024 o aproximadamente 0.01 

e) STATISTIX sólo evalúa probabilidades binomiales acumuladas. Con el cuadro de diálogo de la figura 7-5 se obtiene 
la distribución de probabilidad binomlal acumulada para N = 5, p = 0.4, q = 0.6 y x = 0,1,4 y 5. 



Figura 7-5 STATISTIX, cuadro dediálogo para el problema 7.8e). 
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M ediante la información obtenida en el último cuadro de diálogo, se tiene que: la probabilidad de que ninguno se titule es 
Pr{X = 0} = Blnomial(0,5,0.4) = 0.07776. La probabilidad de que 1 se titule es Pr{X = 1} = Pr{X < 1} - Pr{X < 0} = 
Binomial (1,5,0.4) - Binomial (0,5,0.4) = 0.33696 - 0.07776 = 0.2592. La probabilidad de que por lo menos 1 se titule es 
Pr{X > 1} = 1 - Pr{X = 0} = 1 - B inomial(0,5,0.4) = 0.92224. La probabilidad de que todos se titulen es Pr{X = 5} = 
Pr{X < 5} - Pr{X < 4} = Binomial(5,5,0.4) -Binomial(4,5,0.4) = 1.00000 - 0.98976 = 0.01024. Obsérvese que 
STATISTIX únicamente da la probabilidad binomial acumulada y también algunas de las tablas que aparecen en los libros 
de texto dan únicamente probabilidades binomial es acumuladas. 


7.9 ¿Cuál es la probabilidad de que en 6 lanzamientos de un par de dados se obtenga como suma 9: a) dos veces y 
b) por lo menos 2 veces? 

SOLUCIÓN 


Cada una de las 6 maneras en que puede caer el primer dado se asocia con cada una de las 6 maneras en que puede caer el 
segundo dado; por lo tanto, hay 6 ■ 6 = 36 maneras en que pueden caer los dos dados. Se puede tener: 1 en el primer dado 
y 1 en el segundo dado, 1 en el primer dado y 2 en el segundo dado, etc., lo que se denota (1,1), (1, 2), etcétera. 

De estas 36 maneras (todas igualmente probables), la suma 9 se obtiene en 4 casos: (3, 6), (4, 5), (5, 4) y (6, 3). Por 
lo tanto, la probabilidad de que en un lanzamiento de los dos dados la suma sea 9 es p = ^ = T y la probabilidad de que en 
un lanzamiento la suma de los dos dados no sea 9 es q = 1 -p = §. 


a) Pr{2 nueves en 6 lanzamientos} = 


61 440 
531 441 


b ) Prjpor lo menos 2 nueves} = Pr{2 nueves} + Pr{3 nueves} + Pr{4 nueves} + Pr{5 nueves} + Pr{6 nueves} 


+ 


+ 


+ 


+ 


_ 61 440 10 240 960 48 1 _ 72 689 

“ 531 441 + 531 441 + 53 1441 + 531 441 “ 531 441 “ 531 441 

Otro método 

Prjpor lo menos 2 nueves} = 1 - Pr{0 nueves} - Pr{l nueve} 


= 1 - 


07 V9 


72 689 
531 441 


N\ x N-X 


7.10 Evaluar: a) J2x=o x p( x ) Y b ) E.Lo x PÍ X )' donde PÍ X ) = (i)/? 


SOLUCIÓN 

a) Comog + p = l, 


N N 

X=0 X=i 


m 


X\ (N — X)\ 


p x q N x 




(N — 1)! 


í (X-l)l(iV-X)! 


p x -\ N - x 


= Np(q + p) N 1 = Np 


b) y j x 2 P {x) = y j x 2 

X=Q 


N\ 


x=\ 

N 


X\(N-X)\ 


p X q N - X 


= Y,[x{x-\) + x] 

x=\ 


N\ 


X\{N-X)\ 


P X C 1 NX 


= E^-i) 


TV! 

X\(N -X)\ 


p x q N x 


+ Í2 X XK N-X)\ pXg * 


= N(N- 1)/E 


(TV-2)! 


{X — 2)!(W — X)! 


p x ~ 2 qN X + Np = N(N - 1 )p 2 (q + p) N - 2 + Np 


= N{N- 1 )p +Np 
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Nota: Los resultados de los incisos a) y ib) son las esperanzas deX y deX 2 , que se denotan E(X) y E (X 2 ), respecti¬ 
vamente (ver capítulo 6). 

7.11 SI la variable está distribuida blnomlalmente, determinar: a) su media p y b) su varlanza o- 2 . 

SOLUCIÓN 

a) De acuerdo con el problema 7.10a), 

N 

p = esperanza de la variable = ^ Xp(X) = Np 

x=o 

b ) Empleando p = Npy los resultados del problema 7.10, 

a 2 = J2(X- p) 2 p(X) = ^(X 2 - 2pX + p 2 )p(X) = ¿ X 2 p(X) Xp(X) + p 2 f>(X) 

X=0 X=0 X=0 X=0 JT=0 

= N{N - 1 )p 2 + Np — 2(Np)(Np) + (1V/?) 2 (1) = Np — Np 2 = Np{ 1 -p) = Npq 

Se sigue que la desviación estándar de una variable distribuida en forma binomial es o = sJNpq. 

Otro método 

De acuerdo con el problema 6.62 b), 

E[(X - X)] 2 = E(X 2 ) - [E(X)\ 2 = N{N - 1 )p 2 + Np - N 2 p 2 = Np - Np 2 = Npq 

7.12 SI la probabilidad deque un tornillo esté defectuoso es 0.1, encontrar: a) la media y b) la desviación estándar 
de la distribución de los tornillos defectuosos en un total de 400 tornillos. 

SOLUCIÓN 

a) La media es Np = 400(0.1) = 40; es decir, se puede esperar que haya 40 tornillos defectuosos. 

b) La varianza es Npq = 400(0.1)(0.9) = 36. Por lo tanto, la desviación estándar es \/36 = 6. 

7.13 Encontrar el coeficiente momento de: a) sesgo y b) curtosis, de la distribución del problema 7.12. 

SOLUCIÓN 

a) Coeficiente momento de sesgo = q p = °’ 9 0,1 = 0.133 

\JNpq 6 

Como este coeficiente es positivo, la distribución es sesgada a la derecha. 

b) Coeficiente momento de curtosis = 3 + 1 K 6pq = 3 + ^— 6 (Q-l)(0-9) = 3.01 

Npq 36 

Esta distribución es ligeramente leptocúrtica con respecto a la distribución normal (es decir, ligeramente más puntia¬ 
guda; ver capítulo 5). 


LA DISTRIBUCIÓN NORMAL 

7.14 En un examen final de matemáticas la media fue 72 y la desviación estándar fue 15. Determinar las puntuacio¬ 
nes estándar (es decir, las calificaciones en unidades de desviaciones estándar) délos estudiantes que obtuvie¬ 
ron: a) 60, b) 93 y c) 72 puntos. 

SOLUCIÓN 


, X - X 60- 72 „ „ , X - X 72- 72 „ 

a) z = -= ——— = —0.8 c) z = -= —7^— = 0 


15 


,, X - X 93 - 72 , „ 
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7.15 Con los datos del problema 7.14, encontrar las calificaciones que corresponden a las siguientes puntuaciones 
estándar: a) -1 y b) 1.6. 

SOLUCIÓN 

a) X = X + zs = 12 + (—1)(15) = 57 b) X = X + zs = 72 + (1.6)(15) = 96 

7.16 Supóngase que la cantidad de juegos en que participan los beisbolistas de la liga mayor durante su carrera se 
distribuye normalmente con media 1 500 juegosy desviación estándar 350 juegos. EmplearEXCEL para res¬ 
ponder las preguntas siguientes, a) ¿Qué porcentaje participa en menos de 750 juegos? b) Qué porcentaje 
participa en más de 2 000 juegos? y c) Encontrar el percentil 90 de la cantidad de juegos en los que participan 
durante su carrera. 

SOLUCIÓN 

a) La expresión de EXCEL =l\IORM DIST(750,1 500, 350,1) busca el área a la Izquierda de 750 en una curva normal 
con media Igual a 1 500 y desviación estándar Igual a 350. La respuesta es Pr{X < 750} = 0.0161 o bien 1.61% par¬ 
ticipa en menos de 750 juegos. 

b) La expresión de EXCEL =l-NORM DIST(2 000,1 500, 350,1) busca el área a la derecha de 2 000 en una curva nor¬ 
mal con media igual a 1 500 y desviación estándar igual a 350. La respuesta es Pr{X > 2 000} = 0.0766 o bien 7.66% 
participa en más de 2 000 juegos. 

c) La expresión de EXCEL =l\IORM INV(0.9,1 500, 350) busca en el eje horizontal el valor tal que a su izquierda se 
encuentra 90% del área bajo la curva normal con media 1 500 y desviación estándar 350. Empleando la notación del 
capítulo 3, P 90 = 1 948.5. 

7.17 Encontrar el área bajo la curva normal en los casos siguientes. 

a) Entrez= 0.81 y z = 1.94. 

b) A la derecha de z= -1.28. 

c) A la derecha dez= 2.05 o a la izquierda dez = -1.44. 

Para resolver los Incisos a) a c) emplear el apéndice II y EXCEL [ver la figura 7-6, Incisos a), b) y c)j. 

SOLUCIÓN 

a) En el apéndice II, bajar por la columnaz hasta llegar a 1.9; después avanzar a la derecha hasta la columna marcada 
con4. El resultado 0.4738 es Pr{0 < z < 1.94}. A continuación bajar por la columnaz hasta llegar a 0.8; después avan¬ 
zar a la derecha hasta la columna marcada con 1. El resultado 0.2910 es Pr{0 < z < 0.81}. El área correspondiente a 
Pr{0.81 < z < 1.94} es la diferencia de ambos, Pr{0 < z < 1.94} - Pr{0 < z < 0.81} = 0.4738 - 0.2910 = 0.1828. 
Empleando EXCEL, la respuesta se obtiene con =NORM SDIST(1.94J-NORM SDIST(0.81) = 0.1828. Empleando 
EXCEL, el área Pr{0.81 < z< 1.94} es la diferencia Pr{—infinito < z< 1.94} - Pr{—infinito <z < 0.81}. Obsérvese 
que la tabla del apéndice II da áreas desde 0 hasta un valor positivo dez, en tanto que EXCEL da áreas desde -infinito 
hasta el mismo valor dez. 

b) El área a la derecha dez = -1.28 es la misma área que a la Izquierda dez = 1.28. Empleando el apéndice II, el área 
a la izquierda de z = 1.28 es Pr{z < 0} + Pr{0 < z < 1.28} o bien 0.5 + 0.3997 = 0.8997. Usando EXCEL, 
Pr{z > -1.28} = Pr{z < 1.28} y Pr{z < 1.28} se obtiene mediante =N OR M SDI ST(1.28), que da 0.8997. 

c) Empleando el apéndice II, el área a la derecha de 2.05 es 0.5 - Pr{z < 2.05} o bien 0.5 - 0.4798 = 0.0202. El área 
a la izquierda de-1.44 es la misma que el área a la derecha de 1.44. El área a la derecha de 1.44 es 0.5- Pr{z< 1.44} 
= 0.5 - 0.4251 = 0.0749. La suma de estas dos áreas en las colas es 0.0202 + 0.0749 = 0.0951. Usando EXCEL, esta 
área se obtiene como sigue: =NORM SD I ST (1.44) + (1 - NORM SD IST (2.05)), que da 0.0951. 

Obsérvese que en EXCEL =NORM SDIST(z) da el área a la izquierda dez bajo la curva normal estándar, en tanto 
que =NORM DIST(z, /x, a, 1) da el área a la izquierda dez bajo la curva normal cuya media es ¿¿ y cuya desviación están¬ 
dar de a. 
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b) 



Figura 7-6 Áreas bajo la curva normal estándar, a) Área entrez = 0.81 y z = 1.94; b) área a la derecha dez = 
c) área a la izquierda dez = -1.44 más área a la derecha dez = 2.05. 


-1.28; 
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7.18 La cantidad de horas, por semana, que los estudiantes de educación media ven televisión tiene una distribución 
normal cuya media es 20.5 horas y cuya desviación estándar es 5.5 horas. Emplear M INITAB para hallar el 
porcentaje que ve televisión menos de 25 horas por semana. UsarM INITAB para hallar el porcentaje que ve 
televisión más de 30 horas por semana. Trazar una curva que represente estos dos grupos. 

SOLUCIÓN 

La solución se ilustra en la figura 7-7. 



Figura 7-7 M INITAB, gráfica que muestra el grupo que ve televisión menos de 25 horas por semana 
y el grupo que ve televisión más de 30 horas por semana. 


La secuencia "Cale => Probability distributions => Normal" abre el cuadro de diálogo de la distribución normal 
que se presenta en la figura 7-8. 



Figura 7-8 M INITAB, cuadro de diálogo para la distribución normal. 
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Llenando el cuadro de diálogo como se muestra en la figura 7-8 y ejecutándolo, se obtiene el siguiente resultado: 
Función de distribución acumulada 

Ñor mal con media = 20.5 y desviación estándar = 5.5 

x P(X<=x) 

25 0.793373 

79.3% délos estudiantes de educación media ven 25 horas o menos de televisión por semana. 

Si se ingresa 30 como la constante de entrada, se obtiene el resultado siguiente: 

Función de distribución acumulada 

Ñor mal con media = 20.5 y desviación estándar = 5.5 

x P(X<=x) 

30 0.957941 

El porcentaje que ve más de 30 horas de televisión por semana es 1 - 0.958 = 0.042 o 4.2%. 

7.19 Hallar la ordenada correspondiente a la curva normal en: a) z = 0.84, b) z= -1.27 y c) z = -0.05. 

SOLUCIÓN 

a) En el apéndice I, bajar por la columna que tiene como encabezado z hasta llegar a la entrada 0.8; después avanzar hada 
la derecha hasta la columna que tiene como encabezado 4. La entrada 0.2803 es la ordenada buscada. 

b ) Por simetría: (ordenada correspondiente az = -1.27) = (ordenada correspondiente az = 1.27) = 0.1781. 

c) (La ordenada correspondiente z = -0.05) = (la ordenada correspondiente az = 0.05) = 0.3984. 

7.20 Emplear EX C EL para evaluar algunas ordenadas correspondientes a la curva normal cuya media es 13.5 y cuya 

desviación estándar es 2.5. Después, empleando el asistente para gráficos, graficar los puntos obtenidos. Estas 

gráficas representan la distribución normal de la variableX, dondeX representa las horas, por semana, que los 

estudiantes universitarios pasan en Internet. 

SOLUCIÓN 

Las abscisas elegidas que van desde 6 hasta 21, a intervalos de 0.5, se ingresan en la hoja de cálculo de EXCEL en las 
celdas ALA 31. En la celda B1 se ingresa la expresión =NORM DIST (A 1,13.5,3.5,0), se hace clic y se arrastra. Estos pun¬ 
tos son de la curva normal cuya media es 13.5 y cuya desviación estándar es 3.5: 


6 

0.001773 

6.5 

0.003166 

7 

0.005433 

7.5 

0.008958 

8 

0.01419 

8.5 

0.021596 

9 

0.03158 

9.5 

0.044368 

10 

0.059891 

10.5 

0.077674 

11 

0.096788 

11.5 

0.115877 

12 

0.13329 

12.5 

0.147308 

13 

0.156417 

13.5 

0.159577 
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14 

0.156417 

14.5 

0.147308 

15 

0.13329 

15.5 

0.115877 

16 

0.096788 

16.5 

0.077674 

17 

0.059891 

17.5 

0.044368 

18 

0.03158 

18.5 

0.021596 

19 

0.01419 

19.5 

0.008958 

20 

0.005433 

20.5 

0.003166 

21 

0.001773 


Para graficar estos puntos se emplea el asistente para gráficos. El resultado se muestra en la figura 7-9. 



Figura 7-9 EXCEL, gráfica déla curva normal cuya media es = 13.5 y cuya desviación estándar es = 2.5. 


7.21 Determinar el segundo cuartil (Q 2 ), el tercer cuartll (Q 3 ) y el percentll 90 (P 90 ) de las horas, por semana, que 
los estudiantes universitarios pasan en Internet. Emplear la distribución normal dada en el problema 7.20. 

SOLUCIÓN 

El segundo cuartll o percentll 50 de una distribución normal corresponde al centro de la curva. Debido a la simetría de esta 
distribución, coincide con el punto en el que se encuentra la media. En el caso del uso de Internet, éste será 13.5 horas por 
semana. Para hallar el percentll 50, se usa la función de EXCEL =l\IORM INV(0.5,13.5,2.5). El percentll 50 significa que 
0.5 del área se encuentra a la izquierda del segundo cuartil y que la media es 13.5 y la desviación estándar es 2.5. El resul¬ 
tado queda EXCEL es 13.5. Usando M INITAB se obtiene: 
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Función de distribución acumulada inversa 

Ñor mal con media = 13.5 y desviación estándar = 2.5 

p( X<=x) x 

0.5 13.5 

Esto se ilustra en la figura 7-10 a). En la figura 7-10 b) se nota que el 75% del área bajo la curva está a la Izquierda 
de0 3 . Empleando EXCEL, la función =NORM IN V (0.75,13.5,2.5) daQ 3 = 15.19. 



3 ) 



b) 



Figura 7-10 Se hallan percentiles y cuartiles usando MINITAB y EXCEL, a) Q 2 es el valor tal que 50% 
de los tiempos son menores que ese valor; b) Q 3 esel valor tal que 75% de los tiempos son menores que ese valor; 
c) P 90 es el valor tal que 90% de los tiempos son menores que ese valor. 
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En la figura 7-10c) se muestra que 90% del área está a la izquierda deP 90 . La función de EXCEL =NORM INV (0.90,13.5,2.5) 
daP 90 = 16.70. 

7.22 Usando el apéndice II, encontrar0 3 para los datos del problema 7.21. 

SOLUCIÓN 

Si no se dispone de un software como EXCEL oMINITAB, es necesario trabajar con las tablas de la distribución normal 
estándar como único recurso. 



Figura 7-11 C urva normal estándar. 


Usando el apéndice II en forma inversa, se ve que el área que va desde z = 0 hasta z = 0.67 es 0.2486, y el área que 
va desdez = 0 hastaz = 0.68 es 0.2518 (ver figura 7-11). El área desde -infinito hastaz = 0.675 es aproximadamente 0.75, 
ya que el área desde -infinito a 0 es 0.5, y el área desde 0 hasta z = 0.675 es 0.25. Por lo tanto, en la curva normal estándar 
el tercer cuartil es aproximadamente 0.675. SeaQ 3 el tercer cuartil en la curva normal cuya media es 13.5 y cuya desviación 
estándar es 2.5 [ver figura 7-lOb)]. Cuando Q 3 se transforma en un valor z, se tiene 0.675 = (Q 3 - 13.5)/2.5. Despejando 
en esta ecuación 0 3 , se tiene 0 3 = 2.5(0.675) + 13.5 = 15.19, que es la misma respuesta que se obtuvo con EXCEL en el 
problema 7.21. 


7.23 Se producen arandelas cuyo diámetro interno está distribuido normalmente con media 0.500 pulgadas (in) y 
desviación estándar 0.005 in. Las arandelas se consideran defectuosas si su diámetro interno es de menos de 
0.490 in o si es de más de 0.510 in. Empleando tanto el apéndice II como EXCEL, hallar el porcentaje de 
arandelas defectuosas. 

SOLUCIÓN 


0.490 - 0.500 

0.490 en unidades estándar es--= -2.00 

„ cin ... , 0.510 - 0.500 

0.510 en unidades estándar es--= 2.00 

De acuerdo con el apéndice II, el área a la derecha deZ = 2.00 es 0.5 - 0.4772, o bien 0.0228. El área a la izquierda de 
Z = -2.00 es 0.0228. El porcentaje de defectuosos es (0.0228 + 0.0228) x 100 = 4.56%. Para hallar áreas bajo una curva 
normal empleando el apéndice II hay que convertir los datos a la curva normal estándar para encontrar las respuestas. 
Empleando EXCEL, la respuesta es = 2*NORM DIST(0.490, 0.500, 0.005,1), que da también 4.56%. 
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Figura 7-12 El área a la derecha deX =0.510 es Igual al área a la derecha deZ =2.000 y el área 
a la izquierda deX = 0.490 es igual al área a la Izquierda deZ = -2.00. 


APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL 


7.24 Empleando: a) la distribución blnomlal y b) la aproximación normal a la distribución blnomlal, encontrar la 
probabilidad de que en 10 lanzamientos de una moneda se obtengan 3 a 6 caras Inclusive. 


SOLUCIÓN 

a) Pr{3 caras} 



Pr{5 caras} 




_63_ 

256 


Pr{4 caras} 



105 

512 


Pr{6 caras} 




105 

512 


Por lo tanto 


(de entre 3 a 6 caras inclusive} 


15 105 63 105 99 

128 + 512 + 256 + 512 + 128 


0.7734 


b ) En la figura 7-13 se presenta la gráfica que se obtiene con EXCEL para la distribución binomlal con N = 10 lanza¬ 

mientos de una moneda. 

Obsérvese que aunque la distribución binomlal es una distribución discreta, esta gráfica tiene la forma de una 
distribución normal, que es continua. Para aproximar la probabilidad binomlal de 3, 4, 5 y 6 caras mediante el área 
bajo la curva normal, se busca el área bajo la curva normal desdeX = 2.5 hastaX = 6.5. El 0.5 que se agrega a cada 
lado deX = 3 y X = 6 se le llama corrección por continuidad. A continuación sedan los pasosa seguir para aproximar 
la distribución binomial mediante la distribución normal. Se elige la curva normal con media Np = 10(0.5) = 5 y 
desviación estándar = sJNpq = ^/10(0.5)(0.5) = 1.58. De esta manera se elige la curva normal que tiene el mismo 
centro y la misma variación que la distribución binomial. Después se busca el área bajo la curva desde 2.5 hasta 6.5, 
como se muestra en la figura 7-14. Ésta es la aproximación normal a la distribución binomial. 
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0.3 

0.25 

0.2 

1 

| 0.15 

£ 

0.1 

0.05 

0 

0 2 4 6 8 10 12 

Número de caras 

Figura 7-13 EXCEL, gráfica déla distribución binomial con N = 10y p = 0.5. 




Figura 7-14 Aproximación normal para 3,4,5 o 6 caras cuando se lanza una moneda 10 veces. 


Usando una hoja de cálculo de EXCEL, la solución se obtiene empleando =NORM DIST(6.5, 5, 1.58,1) - 
NORM DIST(2.5, 5,1.58,1), con lo que se obtiene 0.7720. 

Empleando la técnica del apéndice II, los valores normales 6.5 y 2.5 se convierten primero a valores normales están¬ 
dar. (En unidades estándar 2.5 es -1.58, y 6.5 en unidades estándar es 0.95.) De acuerdo con el apéndice II el área entre 
-1.58 y 0.95 es 0.7718. Cualquiera que sea el método que se use, el resultado es muy semejante al obtenido con la distri¬ 
bución binomial, 0.7734. 

7.25 Se lanza una moneda 500 veces. Hallar la probabilidad de que el número de caras no sea diferente de 250: 
a) en más de 10 y b) en más de 30. 

SOLUCIÓN 

fi = Np = (500)0 = 250 <j=s/Ñ^= y/(500)0(1) = 11.18 
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a) Se busca la probabilidad de que la cantidad de caras esté entre 240 y 260 o, considerando los datos como datos conti¬ 
nuos, entre 239.5 y 260.5. Como 239.5 en unidades estándar es (239.5 - 250)/11.18 = -0.94 y 260.5 en unidades 

estándar es 0.94, se tiene 

Probabilidad buscada = (área bajo la curva normal entrez = -0.94 y z = 0.94) 

= (dos veces el área entre z = 0 y z = 0.94) = 2(0.3264) = 0.6528 

b ) Se busca la probabilidad de que la cantidad de caras esté entre 220 y 280 o, considerando los datos como datos conti¬ 
nuos, entre 219.5 y 280.5. Como 219.5 en unidades estándar es (219.5 - 250)/11.18 = -2.73 y 280.5 en unidades 

estándar es 2.73, se tiene 

Probabilidad buscada = (dos veces el área entrez = 0 y z = -2.73) 

= 2(0.4968) = 0.9936 

Por lo tanto, se puede confiar en que el número de caras no diferirá de lo esperado (250) en más de 30. De manera 
que si resulta que el número de caras que realmente se encuentra es 280, habrá razón para creer que la moneda está 
cargada. 


7.26 Supóngase que en el grupo de edad de 1 a 4 años, el 75% usa el cinturón de seguridad de manera habitual. 
Hallar la probabilidad de que si se detienen, al azar, algunos automóviles que transporten pasajeros de 1 a 4 
años, 70 o menos estén usando el cinturón de seguridad. Dar la solución empleando la distribución binomial 
así como la aproximación normal a la distribución binomial. Usar M INITAB para hallar la solución. 

SOLUCIÓN 

El resultado de M INITAB dado adelante muestra que la probabilidad de que 70 o menos estén usando el cinturón de segu¬ 
ridad es igual a 0.1495. 

MTB > cdf 70; 

SUBO b i n o mi al 1 0 0.7 5. 

Función de distribución acumulada 

Binomial con n = 100 y p = 0.750000 
x P( X <= x) 

70.00 0.1495 

Empleando la aproximación normal a la distribución binomial, la solución se e ncuen tra como sigue: la media de la 
distribución binomial es ¡j, = Np = 100(0.75) = 75 y la desviación estándar es a = \/Npq = \/100(0.75)(0.25) = 4.33. 
El resultado de M IN ITAB dado adelante muestra que la aproximación normal es Igual a 0.1493. Esta aproximación es muy 
semejante al verdadero valor. 

MTB > cdf 70.5; 

SUBO media ñor mal = 75 sd = 4.33 
Función de distribución acumulada 

Ñor mal con media = 75.0000 y desviación estándar = 4.33000 
x P( X <= x) 

70.5000 0.1493 


LA DISTRIBUCIÓN DE POISSON 

7.27 De las herramientas que se producen con determinado proceso de fabricación, 10% resultan defectuosas. 
Empleando: a) la distribución binomial y b) la aproximación de Polsson a la distribución binomial, hallar la 
probabilidad de que en una muestra de 10 herramientas elegidas al azar exactamente 2 estén defectuosas. 
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SOLUCIÓN 


La probabilidad de que una herramienta esté defectuosa es p = 0.1. 

a) Pr{2 de 10 herramientas defectuosas} = (0.1) 2 (0.9) 8 = 0.1937 

b) Con A = A Ip = 10(0.1) = 1 y usando e = 2.718, 

A-V a (l)V' e- 1 

Pr{2 de 10 herramientas defectuosas} = = —-— = — 

En general, esta aproximación es buena si p < 0.1 y A = Np < 5. 


o bien 0.19 


—= 0.1839 o bien 

le 


0.18 


7.28 Si la probabilidad de que un Individuo tenga una reacción adversa por la inyección de determinado suero es 
0.001, determinar la probabilidad deque de 2 000 Individuos: a) exactamente 3 y b) más de 2, sufran una reac¬ 
ción adversa. Usar M INITAB y hallar la respuesta empleando tanto Poisson como distribuciones binomial es. 

SOLUCIÓN 

a) En el siguiente resultado de M INITA B seda primero la probabilidad binomial de que exactamente 3 individuos tengan 
una reacción adversa. Después de la probabilidad binomial se da la probabilidad de Poisson empleando A = Np = 
(2 000)(0.001) = 2. La aproximación de Poisson al parecer es en extremo cercana a la probabilidad binomial. 

MTB > pdf 3; 

SUBC> bi n o mi al 2 0 0 0.0 0 1. 


Función de probabilidad de densidad 

Bino mi al con n = 2000 y p = 0.001 
x P ( X = x) 

3.0 0.180 5 

MTB > pdf 3; 

SUBC> poisson 2. 

Función de probabilidad de densidad 

Poisson con mu = 2 
x P( X = x) 

3.00 0.1804 

b ) La probabilidad de que más de dos individuos tengan una reacción adversa se obtiene del P (X < 2). El siguiente 
resultado de M INITA B da como probabilidad dequeX < 2 el resultado 0.6767 usando tanto la distribución binomial 
como la distribución de Poisson. La probabilidad de que más de 2 tengan una reacción adversa es 1 - 0.6767 = 
0.3233. 

MTB > cdf 2; 

SUBC> bi n o mi al 2 0 0 0.0 0 1. 


Función de distribución acumulada 

Bino mi al con n = 2000 y p = 0.001 
x P ( X <= x) 

2.0 0.6 7 6 7 

MTB > cdf 2; 

SUBC> poisson 2. 

Función de distribución acumulada 

Poisson con mu = 2 
P( X <= x) 

0 . 6767 


x 

2 . 0 
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7.29 Una distribución de Poisson está dada por 


P(X) 


(0.72)V OJ2 

X! 


Hallar: a) p(0), b) p(l), c) p(2) y d) p(3). 


SOLUCIÓN 

a) 

b ) 

0 


P(0) 


(0.72) V 0 ' 72 (l) e -°' 72 _ 0 . 72 

0! 1 e 


XI) 

P(2) = 


_ (0.72) 1 e~ 0,72 

“ ÍT~ 

(0.72) 2 e~°' 72 _ 
2 ! “ 


= (0.72) e -° J2 

(0.5184)e~°' 72 

2 


0.4868 usando el apéndice VIII 
= (0.72)(0.4868) = 0.3505 
= (0.2592) (0.4868) = 0.1262 


Otro método 


d) 


p( 2) = p( 1) = (0.36)(0.3505) = 0.1262 

p(3) = {0J2) y e °' 7 ~ = p(2) = (0.24)(0.1262) = 0.0303 


LA DISTRIBUCIÓN MULTINOMIAL 


7.30 Una caja contiene 5 pelotas rojas, 4 pelotas blancas y 3 pelotas azules. De la caja se extrae al azar una pelota, 
se anota su color y se devuelve a la caja. Hallar la probabilidad de que de 6 pelotas extraídas de esta manera, 
3 sean rojas, 2 sean blancas y 1 sea azul. 


SOLUCIÓN 


Pr{roja en cualquier extracción} = X Pr{blanca en cualquier extracción} = y Pr{azul en cualquier extracción} = X 
por lo tanto, 


Pr{3 sean rojas, 2 sean blancas, 1 sea azul} 



625 
5 184 


AJ USTE DE DATOS MEDIANTE DI STRIBUCIONES TEÓRI CAS 

7.31 Ajustar una distribución blnomial a los datos del problema 2.17. 

SOLUCIÓN 

Se tiene Pr{X caras en un lanzamiento de cinco monedas} = p(X ) = fyp x q 5 ~ x , dondep y q son las probabilidades res¬ 
pectivas de cara y de cruz en un lanzamiento de una moneda. De acuerdo con el problema 7.11a), el número medio de 
caras es p, = A/p = 5p. En la distribución de frecuencias reales (u observadas), la cantidad media de caras es 

E K = (38)(0) + (144)(1) + (342)(2) + (287)(3) + (164)(4) + (25)(5) = 2470 
E f i ooo i ooo 

Igualando las medias teórica y real, 5p = 2.47, o bien p = 0.494. Por lo tanto, la distribución binomlal ajustada está 
dada por p(X) = (|.)(0.494) A (0.506) 5_V . 

En la tabla 7.4 se enumeran estas probabilidades así como las frecuencias esperadas (teóricas) y las frecuencias 
reales. El ajuste parece ser bueno. 
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Tabla 7.4 


Número de 
caras (X) 

Pr{X caras} 

Frecuencias 

esperadas 

Frecuencias 

observadas 

0 

0.0332 

33.2 o bien 33 

38 

1 

0.1619 

161.9 o bien 162 

144 

2 

0.3162 

316.2 o bien 316 

342 

3 

0.3087 

308.7 o bien 309 

287 

4 

0.1507 

150.7 o bien 151 

164 

5 

0.0294 

29.4 o bien 29 

25 


7.32 Usarla prueba deKolmogorov-Smlrnov de M INITA B para probarla normalidad de los datos de la tabla 7.5. L 
datos representan el tiempo en horas por semana que 30 estudiantes universitarios usan su teléfono celular. 


Tabla 7.5 


16 

17 

15 

14 

14 

16 

12 

16 

12 

13 

11 

14 

O 

i—1 

15 

14 

13 

15 

16 

17 

13 

15 

14 

18 

14 

11 

12 

13 

13 

15 

12 


SOLUCIÓN 



Horas 

a) 

G ráfica de probabilidad de horas 


Normal 



Horas 


M edia 

14 

Desv están d 

1.948 

N 

30 

KS 

0.031 

Valor P 

>0.150 


b ) 

Figura 7-15 Prueba de Kolmogorov-Smirnov para normalidad: datos normales, a) H istograma que muestra 
un conjunto de datos distribuidos normalmente; b) la prueba de Kolmogorov-Smirnov para normalidad 

indica un valor p > 0.150 para normalidad. 
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El histograma de la figura 7-15a) indica que los datos de esta encuesta están distribuidos normalmente. La prueba 
deKolgomorov-Smirnov también indica que los datos muéstrales provienen de una población distribuida normalmente. La 
mayoría de los especialistas en estadística recomiendan que si el valor p es menor que 0.05, entonces se rechace la hipóte¬ 
sis de normalidad. Aquí el valor pe s > 0.15. 

7.33 Usar la prueba de Kolgomorov-Smirnov de M INITAB para probar la normalidad de los datos presentados en 
la tabla 7.6. Estos datos son el tiempo en horas, por semana, que emplean su teléfono celular 30 estudiantes 
universitarios. 


Tabla 7.6 


18 

16 

11 

17 

12 

13 

17 

17 

17 

16 

18 

17 

16 

17 

17 

16 

18 

15 

18 

18 

16 

16 

16 

17 

14 

18 

15 

11 

18 

10 


H istograma de horas 



Horas 


a) 

G rafica de probabilidad de horas 

Normal 



Horas 


M edia 

15.83 

Desv estánd 2.291 

N 

30 

KS 

0.162 

Valor P 

0.046 


b) 

Figura 7-16 Prueba de Kolgomorov-Smirnov para normalidad; valor p = 0.046, datos no normales, 
a) El histograma muestra un conjunto de datos sesgado a la izquierda; b) la prueba deKolgomorov-Smirnov 

para normalidad indica carencia de normalidad. 
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La mayoría de los especialistas en estadística recomienda que si el valor p es menor que 0.05 se rechace la hipótesis de 
normalidad. En este caso el valor p es menor a 0.05. 


7.34 En la tabla 7.7 se presenta el número de días, f, en el que ocurrieron X accidentes automovilísticos en una ciu¬ 
dad durante un periodo de 50 días. Ajustar a estos datos una distribución de Poisson. 


Tabla 7.7 


Cantidad de 
accidentes (X) 

Cantidad de 
días (f) 

0 

21 

1 

18 

2 

7 

3 

3 

4 

1 


Total 50 


SOLUCIÓN 

La cantidad media de accidentes es 

E fX (21)(0) + (18)(1) + (7)(2) + (3)(3) + (1)(4) 45 

E / 50 50 

Por lo tanto, de acuerdo con la distribución de Poisson, 


Í0 90) e~ 0,90 

Pr{X accidentes} = y - 

Jl ! 

En la tabla 7.8 sedan las probabilidades, deO, 1,2, 3 y 4 accidentes, obtenidas con esta distribución de probabilidad 
de Poisson, así como las cantidades teóricas o esperadas de días con X accidentes (obtenidas multiplicando las probabili¬ 
dades respectivas por 50). Para facilitar la comparación, en la columna 4 se dan nuevamente las cantidades de días de la 
tabla 7.7. 

Obsérvese que el ajuste de la distribución de Poisson a los datos dados es bueno. 


Tabla 7.8 


Cantidad de 
accidentes (X) 

Pr{X accidentes} 

Cantidad esperada 
de días 

Cantidad real 
de días 

0 

0.4066 

23.33 o bien 20 

21 

1 

0.3659 

18.30 o bien 18 

18 

2 

0.1647 

8.24 o bien 8 

7 

3 

0.0494 

2.47 o bien 2 

3 

4 

0.0111 

0.56 o bien 1 

1 


En una distribución de Poisson, la varianza es a 2 = A. Calculando la varianza a partir de la distribución dada se 
obtiene 0.97, lo cual al compararlo con el valor 0.90 de A resulta favorable, y esto puede tomarse como una evidencia más 
de que la distribución de Poisson es adecuada para aproximar los datos muéstrales. 
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PROBLEMAS SUPLEMENTARIOS 


LA DISTRIBUCIÓN BINOMIAL 

7.35 Evaluar a) 7!, Ib) 10!/(6!4!), c), (®) d) (“) y e) (®). 

7.36 Expandir: a) (q + p) 7 y b) (q + p) 10 . 

7.37 Hallar la probabilidad de que al lanzar una moneda seis veces se obtengan: a) 0, b) 1, c) 2, d) 3, e) 4, f) 5 y g) 6 caras. 
h ) Emplear M IIMITAB para construir una distribución de probabilidad paraX = número de caras en seis lanzamientos de 
una moneda. 

7.38 Hallar la probabilidad de que en un solo lanzamiento de seis monedas se obtengan: a) 2 o más caras y b ) menos de4 caras. 

c) Usar EXCEL para hallar las respuestas de los incisos a) y b). 

7.39 Si X denota el número de caras en un solo lanzamiento de cuatro monedas, encontrar: a) Pr{X = 3}, b ) Pr{X < 2}, c) Pr{X 
< 2} y d)Pr{l < X < 3}. 

7.40 De 800 familias con 5 hijos cada una, ¿cuántas se esperaría que tuvieran: a) 3 niños, b ) 5 ni ñas y c) 2 o 3 niños? Supónganse 
¡guales probabilidades para niños y niñas. 

7.41 Encontrar la probabilidad de obtener, en dos lanzamientos de un par de dados, la suma 11: a) una vez y b) dos veces. 

7.42 ¿Cuál es la probabilidad de obtener 9 una sola vez en tres lanzamientos de un par de dados? 

7.43 Hallar la probabilidad de adivinar, correctamente, por lo menos 6 de 10 respuestas en un examen de verdadero y falso. 

7.44 U n vendedor de seguros vende pólizas a 5 hombres, todos de la misma edad y con buena salud. De acuerdo con las tablas 
actuariales, la probabilidad de que un hombre de esta edad esté vivo en 30 años es §. Encontrar la probabilidad de que 
en 30 años estén vivos: a) los 5 hombres, b) por lo menos 3 de estos hombres, c) sólo 2 de estos hombres y d) por lo menos 
1 de ellos, e) Usar EXCEL para responder los Incisos del a) al d). 

7.45 Calcular: a) la media, b ) la desviación estándar, c) el coeficiente momento de sesgo y d) el coeficiente momento de curto- 
sis de la distribución binomial en la quep = 0.7 y N = 60. Interpretar los resultados. 

7.46 M ostrar que si una distribución binomial en la que N = 100 es simétrica, su coeficiente momento de curtosis es 2.98. 

7.47 Evaluar: a) J2 (X - p) 3 p(X) y b)J2 (X ~ ¿OVPO P ara una distribución binomial. 

7.48 Probar las fórmulas (1) y (2) al principio de este capítulo respecto a los coeficientes momento de sesgo y de curtosis. 

LA DISTRIBUCIÓN NORMAL 

7.49 En un examen de estadística, la puntuación media es 78 y la desviación estándar es 10. 

a) Determinar las puntuaciones estándar de dos estudiantes cuyas calificaciones fueron 93 y 62, respectivamente. 

b) Determinar las calificaciones de dos estudiantes cuyas puntuaciones estándar fueron -0.6 y 1.2, respectivamente. 

7.50 Encontrar: a) la media y b) la desviación estándar de las calificaciones obtenidas en un examen en el que 70 y 88 corres¬ 
ponden a las puntuaciones estándar -0.6 y 1.4, respectivamente. 

7.51 Hallar el área bajo la curva normal entre: a) z = -1.20 y z = 2.40; b) z = 1.23 y z = 1.87, y c) z = -2.35 y z = -0.50. 

d) Resolver los incisos del a) al c) empleando EXCEL. 

7.52 Hallar el área bajo la curva normal: a) a la izquierda dez = -1.78, b) a la Izquierda dez = 0.56, c) a la derecha dez = -1.45, 
d) correspondiente az > 2.16, e) correspondiente a -0.80 < z < 1.53 y f) a la izquierda dez= -2.52 y a la derecha dez = 
1.83. g ) Resolver los incisos del a) al f) usando EXCEL. 
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7.53 Si i está distribuida normalmente con media 0 y varianza 1, hallar: a) Pr{z > -1.64}, b ) Pr{-1.96 < z < 1.96} y 
c) Pr{|z| > 1}. 

7.54 Hallar el valor dez tal que: a) el área a la derecha dez sea 0.2266, b ) el área a la izquierda dez sea 0.0314, c) el área entre 
-0.23 y z sea 0.5722, d ) el área entre 1.15 y z sea 0.0730 y e) el área entre -z y z sea 0.9000. 

7.55 Encontrar z l si Pr{z > zj = 0.84, dondez está distribuida normalmente con media 0 y varianza 1. 

7.56 Empleando el apéndice I, encontrar las ordenadas en la curva normal correspondientes a: a) z = 2.25, b) z = -0.32 y 
c) z = -1.18. d ) Resolver los incisos del a) al c) empleando EXCEL. 

7.57 Las estaturas de hombres adultos tienen una distribución normal cuya media es 70 in y cuya desviación estándar es 3 in. 

a) ¿Qué porcentaje mide menos de 65 in? b) ¿Qué porcentaje mide más de 72 in? c) ¿Qué porcentaje está entre 68 y 73 in? 

7.58 Las cantidades gastadas, por determinado grupo de edad, en la compra de artículos en línea tienen una distribución normal 
cuya media es $125 y cuya desviación estándar es $25. a) ¿Qué porcentaje gasta más de $175? b) ¿Qué porcentaje gasta 
entre $100 y $150? c) ¿Qué porcentaje gasta menos de $50? 

7.59 En un examen final la calificación media es 72 y la desviación estándar es 9. Los estudiantes que forman parte del 10% 
superior obtienen A como nota. ¿Cuál es la calificación mínima para obtener A? 

7.60 Si un conjunto de medidas tiene una distribución normal, ¿qué porcentaje de las medidas difiere de la media en: a) más de 
media desviación estándar y b) menos de tres cuartos de desviación estándar? 

7.61 Si X es la media y s es la desviación estándar de un conjunto de mediciones distribuidas normalmente, ¿qué porcentaje de 
las mediciones: a) está dentro del rango X ± 2s, b) están fuera del rango X ± 1.2s y c) son mayores que X - 1.5s? 

7.62 En el problema 7.61 encontrar la constante a tal que el porcentaje de casos: a) dentro del rango X±as sea 75% y b ) meno¬ 
res queX - as sea 22%. 

APROXIMACIÓN NORMALALA DISTRIBUCIÓN BINOMIAL 

7.63 Encontrar la probabilidad de que en 200 lanzamientos de una moneda se obtengan: a) entre 80 y 120 caras inclusive, 

b) menos de 90 caras, c) menos de 85 o más de 115 caras y d) exactamente 100 caras. 

7.64 Encontrar la probabilidad de que en un examen de verdadero o falso un estudiante adivine correctamente las respuestas de: 
a) 12 de 20 preguntas o más y b) 24 de 40 preguntas o más. 

7.65 De los tornillos que se producen con una máquina, 10% está defectuoso. Encontrar la probabilidad de que en una muestra 
aleatoria de 400 tornillos producidos con esta máquina: a) cuando mucho 30, b) entre 30 y 50, c) entre 35 y 45 y d) 55 o 
más de los tornillos estén defectuosos. 

7.66 Encontrar la probabilidad de obtener más de 25 sietes en 100 lanzamientos de un par de dados. 

DISTRIBUCIÓN DE POISSON 

7.67 Si 3% de los bulbos eléctricos fabricados por una empresa están defectuosos, encontrar la probabilidad de que en una 
muestra de 100 bulbos: a) 0, b) 1, c) 2, d) 3, e) 4 y f) 5 bulbos estén defectuosos. 


7.68 


En el problema 7.67, hallar la probabilidad de que: a) más de 5, b) entre 1 y 3 y c) 2 o menos bulbos estén defectuosos. 
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7.69 U na bolsa contiene 1 canica roja y 7 canicas blancas. Déla bolsa se extrae una canica y se observa su color. Después se 
regresa la canica a la bolsa y el contenido de la bolsa se mezcla bien. Usando: a) la distribución binomial y b) la aproxima¬ 
ción de Poisson a la distribución binomial, encontrar la probabilidad de que en 8 extracciones se extraiga exactamente 3 
veces una canica roja. 

7.70 Según la oficina de estadística del Departamento de Salud de Estados U nidos, en ese país la cantidad anual de ahogados 

accidentalmente es 3 por 100 000 habitantes. Encontrar la probabilidad de que en una ciudad en que la población es de 

200 000 habitantes haya anualmente: a) 0, b ) 2, c) 6, d) 8, e) entre 4 y 8, y f) menos de 3 ahogados en forma accidental. 

7.71 En una empresa, la cantidad promedio de llamadas que llegan al conmutador entre las 2 y las 4 de la tarde es 2.5 por 

minuto. Encontrar la probabilidad de que en determinado minuto haya: a) 0, b) 1, c) 2, d) 3, e) 4 o menos, y f) más de 6 
llamadas. 


LA DISTRIBUCIÓN MULTINOMIAL 

7.72 U n dado se lanza seis veces. Hallar la probabilidad de que se obtengan: a) un 1, dos 2 y tres 3, y b) una vez cada lado. 

7.73 U na caja contiene una gran cantidad de canicas rojas, blancas, azules y amarinasen la proporción 4:3:2:1, respectivamen¬ 
te. Encontrar la probabilidad de que en diez extracciones los colores de las canicas sean: a) 4 rojas, 3 blancas, 2 azules y 
una amarilla y ó) 8 rojas y 2 amarillas. 

7.74 Encontrar la probabilidad de que en cuatro lanzamientos de un dado no se obtengan 1, 2 ni 3. 

AJUSTE DE DATOS A DISTRIBUCIONESTEÓRICAS 

7.75 Ajustar la distribución binomial a los datos de la tabla 7.9. 


Tabla 7.9 


X 

0 

1 

2 

3 

4 

f 

30 

62 

46 

10 

2 


7.76 En una encuesta realizada a estudiantes de educación media se determinaron las horas de ejercicio que practican por sema¬ 
na. Usando STATISTIX, construir un histograma con los datos. Empleando la prueba de Shapiro-WiIk de STATISTIX, 
determinar si los datos provienen de una distribución normal. Los datos aparecen en la tabla 7.10. 


Tabla 7.10 


5 

10 

2 

3 

2 

5 

5 

1 

3 

15 

1 

2 

20 

3 

1 

4 

4 

4 

3 

5 


7.77 Con los datos de la tabla 7.5 del problema 7.32, construir un histograma empleando STATISTIX. Empleando la prueba de 
Shapiro-W i Ik de STATISTIX, determinar si los datos provienen de una distribución normal. 

7.78 Las puntuaciones de examen de la tabla 7.11 siguen una distribución en forma de U, que es exactamente lo opuesto a una 
distribución normal. Con estos datos, construir un histograma empleando STATISTIX. Usando la prueba de Shapiro-W ¡Ik 
de STATISTIX, determinar si los datos provienen de una distribución normal. 
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Tabla 7.11 


20 

90 

10 

40 

90 

20 

80 

70 

50 

70 

40 

90 

90 

70 

10 

60 

30 

80 

10 

20 

30 

30 

10 

20 

10 

80 

90 

60 

50 

80 


7.79 Emplee los datos de la tabla 7.11. Usando la prueba de A nderson-Darling y la de Ryan-Joiner de M INITAB, determinar si 
los datos provienen de una distribución normal. 

7.80 Los datos de la tabla 7.12 provienen de 10 cuerpos de la armada prusiana y corresponden a un periodo de 20 años (1875 a 
1894). Estos datos muestran la cantidad de muertes, por año, debidas a patadas de caballo. Ajustar una distribución de 
Poisson a los datos. 


Tabla 7.12 


X 

0 

1 

2 

3 

4 

f 

109 

65 

22 

3 

1 








TEORÍA ELEMENTAL 
DEL MUESTREO 



TEORÍA DEL MUESTREO 

La teoría del muestreo es el estudio déla relación que existe entre una población y las muestras que se obtienen deesa 
población. La teoría del muestreo se emplea en muchos contextos. Por ejemplo, en la estimación de cantidades pobla- 
cionales desconocidas (como la media y la varlanza poblacionales), a las que se les conoce como parámetros 
poblacionales o simplemente parámetros, a partir de las correspondientes cantidades muéstrales (como la media y la 
varlanza muéstrales), a menudo conocidas como estadísticos muéstrales o simplemente estadísticos. El problema de 
la estimación se estudia en el capítulo 9. 

L a teoría del muestreo también sirve para determl nar si las diferencias que se observan entre dos muestras se deben 
a variaciones casuales o si son diferencias realmente significativas. Tales preguntas surgen, por ejemplo, al probar un 
nuevo suero para el tratamiento de una enfermedad o cuando se ti ene que decidir si un proceso de producción es mejor 
que otro. Para responder a estas preguntas se usan las llamadas pruebas de significancia o de hipótesis, fundamentales 
en la teoría de decisiones. Estos temas se tratan en el capítulo 10. 

En general, al estudio de las Inferencias que se hacen acerca de una población, empleando muestras obtenidas de 
ella, y de las Indicaciones de la exactitud de tales Inferencias, mediante el uso de la teoría de la probabilidad, es a lo 
que se le llama inferencia estadística. 

MUESTRAS ALEATORIAS Y NÚM E ROS ALE ATORIOS 

Para que las conclusiones que se obtienen empleando la teoría del muestreo y la inferencia estadística sean válidas, las 
muestras deben elegirse de manera que sean representativas de la población. AI estudio délos métodos de muestreo y 
de los problemas relacionados con ellos se le conoce como diseño de experimentos. 

U na manera de obtener una muestra representativa es mediante un proceso llamado muestreo aleatorio, mediante 
el cual cada uno de los miembros de la población tiene la misma posibilidad de ser incluido en la muestra. Una técni¬ 
ca para obtener una muestra aleatoria consiste en asignarle, a cada miembro déla población, un número, escribir estos 
números en pedazos pequeños de papel, colocarlos en una urna y después extraer los números de la urna, teniendo 
cuidado de mezclar muy bien antes de cada extracción. U na alternativa a este método es usar una tabla de números 
aleatorios (ver el apéndice IX), la cual se construye especialmente para este fin. Ver el problema 8.6. 
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MUESTREO CON REPOSICIÓN Y SIN ELLA 

Si se extrae un número de una urna, antes de extraer otro, el número puede ser devuelto a la urna (ser repuesto) o no. 
En el primer caso, el número puede ser extraído varias veces, en tanto que en el segundo caso sólo puede ser extraído 
una vez. A un muestreo en el que cada miembro déla población puede ser elegido más deuna vez se le llama muestreo 
con reposición ; en cambio, si sólo puede ser elegido una vez se llama muestreo sin reposición. 

U na población puede ser finita o Infinita. Por ejemplo, si de una urna que contiene 100 canicas se extraen sucesi¬ 
vamente 10 canicas sin reposición, se está muestreando una población finita; en cambio, si se lanza una moneda 50 
veces y se cuenta la cantidad de caras, se está muestreando de una población Infinita. 

U na población finita que se muestrea con reposición puede considerarse teóricamente Infinita, ya que se puede 
extraer cualquier cantidad demuestras sin agotarla población. Para fines prácticos, cuando se muestrea de una pobla¬ 
ción finita pero muy grande, se puede considerar que el muestreo se hace de una población Infinita. 

DISTRIBUCIONES MUESTRALES 

Considérense todas las muestras de tamaño N que pueden extraerse de determinada población (ya sea con reposición 
o sin ella). Para cada muestra se pueden calcular diversos estadísticos (como media o desviación estándar), los cuales 
variarán de una muestra a otra. De esta manera se obtiene una distribución del estadístico de que se trate, a la que se 
le llama distribución muestra!. 

Por ejemplo, si el estadístico de que se trata es la media muestral, a la distribución que se obtiene se le llama dis¬ 
tribución muestral de las medias o distribución muestral de la media. De Igual manera se pueden obtener distribucio¬ 
nes muéstrales de las desviaciones estándar, de las varianzas, de las medianas, de las proporciones, etcétera. 

A cada distribución muestral se le puede calcular su media, su desviación estándar, etc. A sí, se puede hablar de la 
media, de la desviación estándar, de la distribución muestral de las medias, etcétera. 

DISTRIBUCIONES MUESTRALES DE MEDIAS 

Supóngase que de una población finita de tamaño N p > N se extraen, sin reposición, todas las muestras posibles de 
tamaño N. SI se denota con ¡ly y ox respectivamente, a la media y a la desviación estándar de una distribución mues¬ 
tral de las medias, y con ^ y cr, respectivamente, a la media y la desviación estándar poblacionales, entonces 


Az = A Y 


a ¡Np — N 
^ VÑ^Np-l 


( 1 ) 


SI la población es infinita, o si el muestreo se hace con reposición, las fórmulas anteriores se reducen a 


Ax = A y = ^ 


( 2 ) 


SI el valor de N es grande (A/ > 30), la distribución muestral délas medias es aproximadamente normal con media 
pbx y desviación estándar o*, Independientemente de la población (siempre y cuando la media y la varianza poblacio¬ 
nales sean finitas y el tamaño de la población sea por lo menos el doble del tamaño de la muestra). Si la población es 
infinita, este resultado es un caso especial del teorema del limite central de la teoría avanzada de la probabilidad, el 
cual muestra que la exactitud déla aproximación aumenta a medida que/V aumenta. Esto suele Indicarse diciendo que 
la distribución muestral es asintóticamente normal. 

SI la población está distribuida normalmente, la distribución muestral de las medias también es normal aun cuando 
el valor de N sea pequeño (es decir, N < 30). 
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DISTRIBUCIONES MUESTRALES DE PROPORCIONES 

Supóngase que una población sea Infinita y que la probabilidad de ocurrencia de un evento (llamada éxito) es p, y que 
la probabilidad de no ocurrencia del evento esq = 1 - p. La población puede ser, por ejemplo, la délos lanzamientos 
de una moneda, en los que la probabilidad del evento "cara” es p = \. Considérense todas las posibles muestras de 
tamaño N extraídas de esta población, y para cada muestra determínese la proporción P de éxitos. En el caso de una 
moneda, P es la proporción de caras en N lanzamientos. De esta manera se obtiene una distribución muestra! de las 
proporciones cuya media p P y cuya desviación estándar a P están dadas por 



que se pueden obtener de la ecuación (2) sustituyendo ¡i = p y a = yfpq. SI el valor de N es grande (A/ > 30), esta 
distribución muestral es aproximadamente normal. Obsérvese que la población está distribuida en forma binomial. 

Las ecuaciones (3) también son válidas para poblaciones finitas si el muestreo se hace con reposición. En el caso 
de poblaciones finitas en las que el muestreo se hace sin reposición, las ecuaciones (3) se sustituyen por las ecuaciones 
(1) con y¿ = p y a- = y/pq. 

Obsérvese que las ecuaciones (3) pueden obtenerse más fácilmente dividiendo entre A/, la media y la desviación 
estándar [Np y y/Npq) de la distribución binomial (ver capítulo 7). 

DISTRIBUCIONES MUESTRALES DE DI FE R E NCI AS Y SU M AS 

Se supone que se tienen dos poblaciones. Para cada muestra de tamaño A/ 2 tomada de la primera población se calcula 
un estadístico S 1; con lo que se obtiene una distribución muestral de este estadístico S 1( cuya media y desviación están¬ 
dar se denotan p si y er si , respectivamente. De igual manera, para cada muestra de tamaño N 2 tomada de la segunda 
población se calcula un estadístico S 2 , con lo que se obtiene una distribución muestral de este estadístico S 2 , cuya media 
y desviación estándar se denotan p S2 y a S2 , respectivamente. Con todas las posibles combinaciones de estas muestras 
de las dos poblaciones se obtiene una distribución de las diferencias, S 2 - S 2 , a la que se le llama distribución muestral 
de las diferencias de los estadísticos. La media y la desviación estándar de esta distribución muestral se denotan, res¬ 
pectivamente, psi-s 2 Y vsi-si’ Y están dadas por 



(4) 



siempre y cuando las muestras elegidas no dependan, de manera alguna, una de la otra (es decir, las muestras sean 
independientes). 

Si S 2 y S 2 son las medias muéstrales de las dos poblaciones, a las que se les denota X¡ y X 2 , respectivamente, enton¬ 
ces la distribución muestral de las diferencias de las medias está dada para poblaciones infinitas con media y desviación 
estándar (^ y a-¡) y (p 2 y 02 )< respectivamente, por 


l¿Xl-X2 — P-Xl — PX2 — Pl — p2 y 



(5) 


usando las ecuaciones (2). Estas ecuaciones también son válidas para poblaciones finitas si el muestreo se hace con 
reposición. Para poblaciones finitas en las que el muestreo se haga sin reposición, se obtienen ecuaciones similares 
empleando las ecuaciones (1). 








Tabla 8.1 Error estándar de distribuciones muéstrales 


Distribución 

muestral 

Error 

estándar 


Observaciones 

M edia 

af= 7N 


Esta fórmula es válida tanto para muestras grandes como para 
muestras pequeñas. La distribución muestral délas medias seaproxima 
a una distribución normal cuando N > 30, aun cuando la población no 
sea normal. 

Hx = p, la media poblacional, en todos los casos. 




La observación hecha para las medias también es válida en este 
caso. 

ytp = p, en todos los casos. 

Proporciones 

. . /p ( 1 -p) _ [m 

F \ 

N V N 

Desviaciones 


Cuando N > 100, la distribución muestral des es casi normal. 

<t s está dada por (1) sólo si la población es normal (o 
aproximadamente normal). Si la población no es normal, se puede usar 
(2). 

Obsérvese que (2) se reduce a (1) cuando /i 2 = a 2 y ¿¿ 4 = 3<r 4 , lo 
que ocurre en poblaciones normales. 

Cuando N > 100, p s = a muy aproximadamente. 

estándar 

(2) v s = y 

’p4 - 

4N/j, 2 

M edianas 

^med 

IT 1.2533 a 

Cuando N > 30, la distribución muestral de la mediana es casi 
normal. La fórmula dada es válida sólo si la población es normal (o 

2N y/Ñ 

aproximadamente normal). 

Pmed = P 

Primero y tercer 
cuartiles 

<J Q\ = a Q3 

1.3626 a 
y/Ñ 

La observación hecha para las medianas también es válida aquí. 

Pqi Y Pq 3 son cas i ¡guales al primero y tercer cuartiles de la 
población. 

0 bsérvese que a Q2 = cr med 


a D\ = a D9 

1.7094o- 

y/Ñ 


Deciles 

a D2 = a DS 

a D3 = a Dl 

1.4288o 

y/Ñ 

1.3180o 

y/Ñ 

Las observaciones hechas para las medianas también son válidas 
aquí. 

p D1 , p D2 ,■ ■ • son casi iguales al primero, segundo,... deciles de la 
población. 

0 bsérvese que a D5 = cr med . 


a D4 = a D6 

1.2680o 

y/Ñ 


Rangos 

semiinter- 

cuartílicos 

0.7867(7 

Las observaciones hechas para las medianas también son válidas 
aquí. 

p Q es casi igual al rango semiintercuartil poblacional. 

ae Vñ 


( 1 ) a S 2 = o 

\/ 

V N 

Las observaciones hechas para la desviación estándar también son 

Varianzas 

(2) a s2 = \ 

N- 3 2 
^4 N _ X P2 

válidas aquí. Obsérvese que si la población es normal (2) da (1). 
p S 2 = a 2 (l\l - 1 )/N, que es casi igual a a 2 cuando N es grande. 


N 

Coeficiente de 
variación 

V 

av ~ s/2Ñ 

yj 1 + 2ír 

Aquí v = a/ p es el coeficiente de variación poblacional. La 
fórmula dada es válida para poblaciones normales (o casi normales) y 

N > 100. 






























Demostraciones de la teoría elemental del muestreo empleando software 207 


Pueden obtenerse resultados semejantes para las distribuciones muéstrales de las diferencias entre las proporciones 
dedos poblaciones distribuidas en forma binomial con parámetros (p v q-¡) y (p 2 , q 2 ), respectivamente. En este caso, S : 
y S 2 son proporción de éxitos, P 1 y P 2 , y las ecuaciones (4) se transforman en 



( 6 ) 


P-P1-P2 — /Vi ~ MP2 — P\ — P 2 y 


SI A^y N 2 son grandes [N 1( A/ 2 > 30), la distribución muestral de diferencias entre medias o proporciones se aproximan 
mucho a una distribución normal. 

Algunas veces se necesita la distribución muestral de la suma de estadísticos. La media y la desviación estándar 
de estas distribuciones están dadas por 


Ps\+S2 — Asi + AS2 y &S\+S2 — V' T S1 + a S2 


(7) 


suponiendo que las muestras sean independientes. 

ERRORES ESTÁNDAR 

A la desviación estándar déla distribución muestral de un estadístico suele conocérsele como su error estándar. En la 
tabla 8.1 se enumeran los errores estándar de distribuciones muéstrales de varios estadísticos, suponiendo que el mues¬ 
treo es un muestreo aleatorio de una población Infinita (o muy grande) o de una población finita pero hecho el muestreo 
con reposición. Se presentan también algunas observaciones especiales en las que se dan las condiciones bajo las 
cuales son válidas las fórmulas, así como otras observaciones pertinentes. 

Las cantidades p, a, p, /+ y X, s, P, m r denotan media, desviación estándar, proporción y el r-ésimo momento 
respecto a la media, poblacionales y muéstrales, respectivamente. 

Se hace notar que si el tamaño N de la muestra es suficientemente grande, la distribución muestral es normal o casi 
normal. A esto se debe que estos métodos se conozcan como métodos para muestras grandes. Cuando N < 30, a las 
muestras se les llama pequeñas. La teoría de las muestras pequeñas o teoría del muestreo exacto, como se le llama 
algunas veces, se estudia en el capítulo 11. 

Cuando los parámetros poblacionales, por ejemplo, a, p o b ien /+ no se conocen, pueden estimarse con bastante 
exactitud a partir de sus estadísticos muéstrales, s (o bien s = y/N/{N - l)x), P y m r , siempre y cuando las muestras 
sean suficientemente grandes. 

DEMOSTRACIONES DE LATEORÍA ELEM ENTAL DEL MUESTREO 
EMPLEANDO SOFTWARE 

EJEMPLO 1 

En una población grande se define la siguiente variable aleatoria. X es la cantidad de computadoras por hogar; X está distribuida de 
manera uniforme, es decir, p(x) = 0.25 parax = 1, 2, 3 y 4. En otras palabras, 25% de los hogares tiene 1 computadora; 25% tiene 
2 computadoras; 25% tiene tres computadoras y 25% tiene 4 computadoras. La media deX es p. = E xp(x) = 0.25 + 0.5 + 0.75 
+ 1 = 2.5. La varianza deX esa 2 = E x 2 p(x) - \x = 0.25 + 1 + 2.25 + 4 - 6.25 = 1.25. Entonces, la cantidad media de compu¬ 
tadoras por hogar es 2.5 y la varianza de la cantidad de computadoras por hogar es 1.25. 


EJEMPLO 2 


Para enumerar todas las muestras, tomadas con reposición, dedos hogares puede usarse M INITA B. La hoja de cálculo se verá como 
la que se presenta en la tabla 8.2. Las 16 muestras aparecen en C1 y C2, y la media de cada una de ellas en C3. Como la población 
está distribuida de manera uniforme, la probabilidad de cada media muestral es 1/16. Resumiendo, en las columnas C4 y C5 se da 
la distribución de probabilidad. 

Obsérvese que p x = Exp(x) = 1(0.0625) + 1.5(0.1250) H-h 4(0.0625) = 2.5. Como se ve p x = p. Además, a 2 = 

Ex 2 p{x) -ni = 1(0.0625) + 2.25(0.1250) + ■■■ + 16(0.0625) - 6.25 = 0.625 con lo que a? = (a 2 /2). Empleando M IN ITA B 
para dibujar la gráfica de la distribución de probabilidad dex barra se obtiene el resultado que se muestra en la figura 8-1. (Obsérvese 
que i" y x barra se usan indistintamente.) 
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Tabla 8.2 


C1 

hogar 1 

C2 

hogar 2 

C3 

media 

C4 

x barra 

C5 

p(x barra) 

1 

1 

1.0 

1.0 

0.0625 

1 

2 

1.5 

1.5 

0.1250 

1 

3 

2.0 

2.0 

0.1875 

1 

4 

2.5 

2.5 

0.2500 

2 

1 

1.5 

3.0 

0.1875 

2 

2 

2.0 

3.5 

0.1250 

2 

3 

2.5 

4.0 

0.0625 

2 

4 

3.0 



3 

1 

2.0 



3 

2 

2.5 



3 

3 

3.0 



3 

4 

3.5 



4 

1 

2.5 



4 

2 

3.0 



4 

3 

3.5 



4 

4 

4.0 





PROBLEMAS RESUELTOS 
DISTRIBUCIÓN MUESTRAL DE LAS MEDIAS 

8.1 Una población consta de los cinco números 2, 3, 6, 8 y 11. Considerar todas las muestras de tamaño 2 que 
pueden extraerse de esta población con reposición. Encontrar: a) la media de la población, b) la desviación 
estándar de la población, c) la media de la distribución muestral de las medias y d) la desviación estándar de 
la distribución muestral de las medias (es decir, el error estándar de las medias). 
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SOLUCION 

a) 

b ) 


2 + 3 + 6 + 8+11 30 £A 

fi =---= — = 6.0 


(2 - 6) 2 + (3 - 6) 2 + (6 

-6) 2 + (8 

- 6) 2 + ( 

íll-6) 2 

16 + 9 + 0 + 4 + 25 


5 




5 

y a = 3.29. 






Existen 5(5) = 25 muestras de tamaño 2 que pueden extraerse con reposición (ya que a cada uno de 
de la primera extracción le corresponden cada uno de los cinco números de la segunda extracción), 

(2, 2) 

(2, 3) 

(2, 6) 

(2, 8) 

(2, 

11) 

(3, 2) 

(3, 3) 

(3, 6) 

(3, 8) 

(3, 

11) 

(6, 2) 

(6, 3) 

(6, 6) 

(6, 8) 

(6, 

11) 

(8, 2) 

(8, 3) 

(8, 6) 

(8, 8) 

(8, 

11) 

(11,2) 

(11, 3) 

(11, 6) 

(11,8) 

(11, 

11) 

Las medias muéstrales correspondientes 

son 





2.0 

2.5 

4.0 

5.0 

6.5 


2.5 

3.0 

4.5 

5.5 

7.0 


4.0 

4.5 

6.0 

7.0 

8.5 


5.0 

5.5 

7.0 

8.0 

9.5 


6.5 

7.0 

8.5 

9.5 

11.0 



( 8 ) 


y la media de la distribución muestral de las medias es 

suma de todas las medias muéstrales de (8) 150 


Mx = ' 


25 


25 


= 6.0 


lo que ilustra que^ = ¡i. 

d) La varianza o\ de la distribución muestral de las medias se obtiene restándole 6 a cada una de las medias en (8), ele¬ 
vando cada resultado al cuadrado, sumando los 25 resultados obtenidos y dividiendo esta suma entre el 25. El resul¬ 
tado final es og = 135/25 = 5.40 y por lo tanto = V5.40 = 2.32. Esto ilustra que en una población finita en la 
quesemuestrea con reposición (o en una población infinita), a\ = a 2 /N, ya que el lado derecho es 10.8/2 = 5.40, que 
coincide con el valor anterior. 


8.2 Resolver el problema 8.1 considerando que el muestreo se hace sin reposición. 

SOLUCIÓN 

Como en los incisos a) y b) del problema 8.1, /i = 6 y a = 3.29. 

c) Existen (*) = 10 muestras de tamaño 2 que pueden ser extraídas sin reposición (esto significa que se extrae un número 
y después otro diferente al primero) de la población: (2, 3), (2, 6), (2, 8), (2,11), (3, 6), (3, 8), (3,11), (6, 8), (6,11) y 
(8,11). La extracción (2, 3) se considera Igual a la (3, 2). 

Las medias muéstrales correspondientes son 2.5, 4.0, 5.0, 6.5, 4.5, 5.5, 7.0, 7.0, 8.5 y 9.5, y la media de la 
distribución muestral de las medias es 

2.5 + 4.0 + 5.0 + 6.5 + 4.5 + 5.5 + 7.0 + 7.0 + 8.5 + 9.5 , „ 
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lo que ilustra que¿t ? = ¿i. 

d) La varlanza de la distribución muestral de las medias es 


(2.5 — 6.0) 2 


(4.0 — 6.0) 2 + (5.0 — 6.0) 2 + ■ 


■ + (9.5 — 6.0) 2 


10 


= 4.05 


y ay = 2.01. Esto ¡lustra que 


ya que el lado derecho es Igual a 


que es lo que se obtuvo antes. 



10.8 /5-2\ 


4.05 


8.3 Supóngase que las estaturas de 3 000 estudiantes del sexo masculino de una universidad tienen una distribución 
normal con media 68.0 pulgadas (in) y desviación estándar 3.0 ¡n. SI se obtienen 80 muestras, cada una de 25 
estudiantes, ¿cuáles serán la media y la desviación estándar esperadas de la distribución muestral de las medias 
si el muestreo se hace: a) con reposición y b) sin reposición? 

SOLUCIÓN 


El número de muestras de tamaño 25 que teóricamente pueden obtenerse de un grupo de 3 000 estudiantes, con reposición 
y sin ésta son, respectivamente (3 0 00) 25 y í 3 ™ 0 ), que son mucho más que 80. De manera que no se obtendrá una verda¬ 
dera distribución muestral de las medias, sino únicamente una distribución muestral experimental. De cualquier manera, 
dado que el número de muestras es grande, habrá una estrecha coincidencia entre las dos distribuciones muéstrales. Por lo 
tanto, la media y la desviación estándar esperadas serán muy semejantes a las de la distribución teórica. Se tiene: 


a) 


Hx = = 68.0 in y 


a 3 

a * = VN = V25 


0.6 in 


b ) 


¡ix = 68.0 in y 


a ¡N p - N _ 3 /3 000 - 25 

7Ñ y A/ p - 1 " TU V 3 000 - 1 


que es apenas ligeramente menor a 0.6 in y por lo tanto, para fines prácticos, puede considerarse Igual a la del muestreo 
con reposición. 

De esta manera, se espera que la distribución muestral experimental de las medias esté distribuida de manera 
aproximadamente normal con media 68.0 in y desviación estándar 0.6 in. 


8.4 ¿En cuántas de las muestras del problema 8.3 se esperaría encontrar que la media: a) estuviera entre 66.8 y 
68.3 In y b) fuera menor a 66.4 ¡n? 


SOLUCIÓN 


La media X de una muestra, en unidades estándar, está dada por 

_Z-/ ÍJ -_^-68.0 
ax 0.6 


a) 


66.8 en unidades estándar = 


66.8 - 68.0 
ÓTó 


-2.0 


68.3 en unidades estándar = 


68.3 - 68.0 
06 


= 0.5 
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-2.0 0.5 

a) 



b) 

Figura 8-2 Áreas bajo ia curva normal estándar, a) En esta curva normal estándar se muestra 
el área entrez = -2 y z = 0.5. b) E n esta curva normal estándar se muestra el área 
a la izquierda dez = -2.67. 


Como se muestra en la figura 8-2a). 

La proporción de muestras cuya media está entre 66.8 y 68.3 in 

= (área bajo la curva normal entre z = -2.0 y z = 0.5) 

= (área entre z = -2 y z = 0) + (área entre z = 0yz = 0.5) 
= 0.4772 + 0.1915 = 0.6687 

Por lo tanto, la cantidad esperada de muestras es (80)(0.6687) = 56.496, o 53. 


b) 


66.4 en unidades estándar = 


66.4- 68.0 
0.6 


-2.67 


Como se muestra en la figura 8-2 b). 

Proporción de las muestras que tienen una media 

menor que 66.4 in = (área bajo la curva normal a la izquierda dez = -2.67) 
= (área a la Izquierda dez = 0) 

- (área entre z = -2.67 y z = 0) 

= 0.5 - 0.4962 = 0.0038 

Por lo tanto, el número de muestras esperada es (80)(0.0038) = 0.304 o cero. 


Se tienen 500 balines cuyo peso medio es 5.02 gramos (g) y cuya desviación estándar es 0.30 g. Encontrar la 
probabilidad de que todos los balines de una muestra aleatoria de 100 balines, tomada de estos balines, pese: 
a) entre 496 y 500 g y b) más de 510 g. 
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SOLUCIÓN 

Para la distribución muestral de las medias, ¡i x = ¡j,= 5.02g, y 


a x = 


N„ — N 0.30 /500 - 100 


VÑV N - l /Toó V 500 -1 


- = 0.027 g 


a) El peso de los 100 balines, juntos, estará entre 496 y 500 g, si el peso medio de los balines se encuentra entre 4.96 y 
5.00 g. 

4 96 - 5 O 9 

4.96 en unidades estándar = — - Q — = -2.22 

.AA ■ . . . 5.00-5.02 

5.00 en unidades estándar = — ^ — = -0.74 

Como se muestra en la figura 8-3a), 

Probabilidad buscada = (área entrez = -2.22 y z = -0.74) 

= (área entre z = -2.22 y z = 0) - (área entre z = -0.74 y z = 0) 

= 0.4868 - 0.2704 = 0.2164 



a) 



Figura 8-3 Las probabilidades muéstrales se encuentran como áreas bajo la curva normal estándar, 
a) Curva normal estándar en la que se muestra el área entrez = -2.22 y z = -0.74; b) curva normal 
estándar en la que se muestra el área a la derecha dez = 2.96. 


b ) El peso de los 100 balines juntos será mayor a 510 g si el peso medio de los balines es mayor a 5.10 g. 

5.10 en unidades estándar = 5,1 |í? ^ 5 ’°~ = 2.96 

0.027 
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Como se muestra la figura 8-36), 

Probabilidad buscada = (área a la derecha dez = 2.96) 

= (área a la derecha dez = 0) - (área entrez = 0 y z = 2.96) 

= 0.5 - 0.4985 = 0.0015 

Por lo tanto, sólo hay 3 posibilidades en 2 000 de obtener una muestra de 100 balines que juntos pesen más de 510 g. 


a) M ostrar la manera de tomar, de la tabla 2.1, 30 muestras aleatorias (con reposición) de 4 estudiantes cada 
una, empleando números aleatorios. 

b) Encontrar la media y la desviación estándar de la distribución muestral de las medias del inciso a). 

c ) Comparar los resultados del inciso b) con los valores teóricos y explicar cualquier discrepancia. 

SOLUCIÓN 

a) Para enumerar cada uno de los 100 estudiantes se emplean los dígitos: 00,01, 02,.... 99 (ver la tabla 8.3). Por lo tanto, 
los 5 estudiantes cuya estatura está en el intervalo 60-62 están numerados 00-04; los dieciocho estudiantes cuya esta¬ 
tura está en el intervalo 63-65 están numerados 05-22, etc. AI número de cada estudiante se le llama número de mues- 
treo. 


Tabla 8.3 


Estatura (in) 

Frecuencias 

Número de muestreo 

60-62 

5 

00-04 

63-65 

18 

05-22 

66-68 

42 

23-64 

69-71 

27 

65-91 

72-74 

8 

92-99 


D espués, se extraen números de muestreo de una tabla de números aleatorios (apéndice IX). E n el primer renglón 
se encuentra la secuencia 51, 77, 27, 46, 40, etc., la que será considerada como los números del muestreo aleatorios, 
cada uno de los cuales dará la estatura de determinado estudiante. Así, 51 corresponde a un estudiante cuya estatura 
está en el intervalo 66-68 in, estatura que se toma como 67 ¡n (la marca de clase). De igual manera, 77, 27 y 46 dan 
las estaturas 70, 67 y 67 in, respectivamente. 

M ediante este proceso se obtiene la tabla 8.4, en la que se muestra el número de muestreo extraído, la estatura 
correspondiente y la estatura promedio de cada una de las 30 muestras. Es necesario decir que aunque se han tomado 
los números aleatorios del primer renglón de la tabla, igualmente podría haberse partido de cualquier otro lugar de la 
tabla y elegir cualquier otro patrón específico. 

b ) En la tabla 8.5 se da la distribución de frecuencias de las medias muéstrales de las estaturas obtenidas en el Inciso a). 
Ésta es una distribución muestral de las medias, La media y la desviación estándar se obtienen, como de costumbre, 
empleando un método de compilación de los capítulos 3 y 4: 

M edia = A + cu = A + = 67.00 + ( °' 7 ^ (23) = 67.58 in 

N 30 


Desviación estándar = c yJu 2 -ü 2 = - (^)~ = °- 75 y^- = L41in 

c) La media teórica de la distribución muestral de las medias, dada por debe ser igual a la media poblacional ^, que 
es 67.45 in (ver problema 3.22), lo que coincide con el valor 67.58 del inciso b). 

La desviación estándar teórica (error estándar) de la distribución muestral de las medias, dada por <j ? , debe ser 
igual a a/VÑ, donde la desviación estándar poblacional es cr = 2.92 in (ver problema 4.17) y el tamaño de la muestra 
es N =4. Como a/VÑ = 2.92/VÍ = 1.46in, esto coincide con el valor 1.41 in del inciso Jb). Las ligeras discrepancias 
resultan de que sólo se tomaron 30 muestras y de que el tamaño de la muestra es pequeño. 
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Tabla 8.4 


Números muéstrales 
extraídos 

Estaturas 

correspondientes 

Estatura 

media 

Números muéstrales 
extraídos 

Estaturas 

correspondientes 

Estatura 

media 

1 . 

51, 

77, 

27, 

46 

67, 

70, 

67, 

67 

67.75 

16. 

11, 

64, 

55, 

58 

64, 

67, 

67, 

67 

66.25 

2. 

40, 

42, 

33, 

12 

67, 

67, 

67, 

64 

66.25 

17. 

70, 

56, 

97, 

43 

70, 

67, 

73, 

67 

69.25 

3. 

90, 

44, 

46, 

62 

70, 

67, 

67, 

67 

67.75 

18. 

74, 

28, 

93, 

50 

70, 

67, 

73, 

67 

69.25 

4. 

16, 

28, 

98, 

93 

64, 

67, 

73, 

73 

69.25 

19. 

79, 

42, 

71, 

30 

70, 

67, 

70, 

67 

68.50 

5. 

58, 

20, 

41, 

86 

67, 

64, 

67, 

70 

67.00 

20. 

58, 

60, 

21, 

33 

67, 

67, 

64, 

67 

66.25 

6. 

19, 

64, 

08, 

70 

64, 

67, 

64, 

70 

66.25 

21. 

75, 

79, 

74, 

54 

70, 

70, 

70, 

67 

69.25 

7. 

56, 

24, 

03, 

32 

67, 

67, 

61, 

67 

65.50 

22. 

06, 

31, 

04, 

18 

64, 

67, 

61, 

64 

64.00 

8. 

34, 

91, 

83, 

58 

67, 

70, 

70, 

67 

68.50 

23. 

67, 

07, 

12, 

97 

70, 

64, 

64, 

73 

67.75 

9. 

70, 

65, 

68, 

21 

70, 

70, 

70, 

64 

68.50 

24. 

31, 

71, 

69, 

88 

67, 

70, 

70, 

70 

69.25 

10. 

96, 

02, 

13, 

87 

73, 

61, 

64, 

70 

67.00 

25. 

11, 

64, 

21, 

87 

64, 

67, 

64, 

70 

66.25 

11. 

76, 

10, 

51, 

08 

70, 

64, 

67, 

64 

66.25 

26. 

03, 

58, 

57, 

93 

61, 

67, 

67, 

73 

67.00 

12. 

63, 

97, 

45, 

39 

67, 

73, 

67, 

67 

68.50 

27. 

53, 

81, 

93, 

88 

67, 

70, 

73, 

70 

70.00 

13. 

05, 

81, 

45, 

93 

64, 

70, 

67, 

73 

68.50 

28. 

23, 

22, 

96, 

79 

67, 

64, 

73, 

70 

68.50 

14. 

96, 

01 , 

73, 

52 

73, 

61, 

70, 

67 

67.75 

29. 

98, 

56, 

59, 

36 

73, 

67, 

67, 

67 

68.50 

15. 

07, 

82, 

54, 

24 

64, 

70, 

67, 

67 

67.00 

30. 

08, 

15, 

08, 

84 

64, 

64, 

64, 

70 

65.50 


Tabla 8.5 


M edla muestral 

Cuenta 

f 

u 

fu 

fu 2 

64.00 

/ 

i 

-4 

-4 

16 

64.75 


0 

-3 

0 

0 

65.50 

// 

2 

-2 

-4 

8 

66.25 

#/ 

6 

-1 

-6 

6 

A -> 67.00 

lili 

4 

0 

0 

0 

67.75 

lili 

4 

1 

4 

4 

68.50 

HMI 

7 

2 

14 

28 

69.25 

nn 

5 

3 

15 

45 

70.00 

/ 

1 

4 

4 

16 



J2f=N = 30 


£f“ = 23 

£ fu 2 = 123 


DISTRIBUCIÓN MUESTRAL DE PROPORCIONES 

8.7 Encontrar la probabilidad de que en 120 lanzamientos de una moneda: a) menos del 40% o más del 60% sean 
cara y b) f o más sean cara. 

SOLUCIÓN 
Primer método 

Los 120 lanzamientos de la moneda se consideran una muestra de la población infinita de todos los posibles lanzamientos de 
una moneda. En esta población la probabilidad de obtener cara es p = i y la probabilidad de obtener cruz es q= 1 -p = i 
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a) La probabilidad que se busca es que en 120 lanzamientos, la cantidad de caras sea menor a 48 o mayor a 72. Se pro¬ 
cederá, como en el capítulo 7, empleando la aproximación normal a la binomial. Como el número de caras es una 
variable discreta, se busca la probabilidad de que el número de caras sea menor a 47.5 o mayor a 72.5. 

H = número esperado de caras =Np= 1200 = 60 y a = y/Npq = ^/( 120) 00 = 5.48 


47.5 en unidades estándar = 47,5 jo 6 ° = -2.28 

5.48 

72.5 en unidades estándar = —— = 2.28 

5.48 


Como se muestra en la figura 8-4, 

Probabilidad buscada = (área a la izquierda de -2.28 más área a la derecha de 2.28) 
= (2(0.0113) = 0.0226) 



Figura 8-4 En la aproximación normal a la binomial se usa la curva normal estándar. 


Segundo método 


Hp = P 

40% 



0.40-0.50 

en unidades estándar = ————-— 
0.0456 


= 0.0456 


-2.19 


rnn , ... , 0.60-0.50 

60% en unidades estándar = ————— = 2.19 

0.0456 

Probabilidad buscada = (área a la izquierda de -2.19 más área a la derecha de 2.19) 
= (2(0.0143) = 0.0286) 


Aunque este resultado es exacto a dos cifras significativas, no hay una coincidencia exacta debido a que no se usó el 
hecho de que una proporción es en realidad una variable discreta. Para tomar en cuenta esto, a 0.40 se le resta 
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1/2N = 1/2(120) y a 0.60 se le suma 1/2N = 1/2(120); como 1/240 = 0.00417, las proporciones buscadas son, en 
unidades estándar, 


0.40 -0.00417- 0.50 0.60 + 0.00417 - 0.50 „ „„ 

-04)456-=" 2 - 28 y -04)456-= 2 ‘ 28 

con lo que se obtiene coincidencia con el primer método. 

Obsérvese que (0.40 - 0.00417) y (0.60 + 0.00417) corresponden a las proporciones 47.5/120 y 72.5/120 
usadas en el primer método. 

b) U sando el segundo método del inciso a) se encuentra que como f = 0.6250, 

, nn „ ... ., . 0.6250- 0.00417- 0.50 „ 

(0.6250 - 0.00417) en unidades estándar =-0 0456- = 2,65 

Probabilidad buscada = (área bajo la curva normal a la derecha dez = 2.65) 

= (área a la derecha dez = 0) - (área entrez = 0 y z = 2.65) 

= 0.5 - 0.4960 = 0.0040 


8.8 Cada una de las 500 personas de un grupo lanza una moneda 120 veces. ¿Cuántas personas pueden esperar: 
a) que entre el 40% y el 60% de sus lanzamientos sean cara y b) en f, o más, de sus lanzamientos obtener 
cara? 

SOLUCIÓN 

Este problema está estrechamente relacionado con el problema 8.7. Aquí se consideran 500 muestras, cada una de tamaño 
120, tomadas de la población infinita de todos los posibles lanzamientos de una moneda. 

a) En el inciso a) del problema 8.7 se establece que de todas las muestras posibles, cada una consistente en 120 lanza¬ 
mientos de una moneda, se puede esperar que en el 97.74% délas mismas se tenga entre 40% y 60% de caras. Entonces, 
en 500 muestras se puede esperar que aproximadamente (97.74% de 500) = 489 muestras tengan esta propiedad. Se 
concluye que alrededor de 489 personas pueden esperar que en su experimento entre 40% y 60% sean caras. 

Es interesante observar que hay 500 - 489 = 11 personas para las que se espera que el porcentaje de caras que 
obtengan no esté entre el 40 y el 60%. Estas personas pueden concluir, con razón, que su moneda esté cargada. Este 
tipo de error es un riesgo siempre presente cuando se trata con probabilidad. 

b ) Razonando como en el inciso a) se concluye que aproximadamente (500)(0.0040) = 2 personas obtendrán caras en f, 
o más, de sus lanzamientos. 


8.9 Se encuentra que el 2% de las herramientas producidas con determinada máquina están defectuosas. ¿Cuál es 
la probabilidad de que en un pedido de 400 de estas herramientas: a) 3% o más y b) 2% o menos resulten 
defectuosas? 

SOLUCIÓN 


fij> = p — 0.02 y 



(0.02) (0.98) 
400 


0.14 

^2CT 


0.007 


a) Primer método 

Empleando la corrección para variables discretas, 1/2/V = 1/800 = 0.00125, se tiene 


.... ... ., . 0.03 -0.00125 - 0.02 , 

0.03 - 0.00125 en unidades estándar =-= 1.25 

0.007 

Probabilidad buscada = (área bajo la curva normal a la derecha dez = 1.25) = 0.1056 
Si no se usa la corrección, se obtiene 0.0764. 
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Otro método 

(3% de 400) = 12 herramientas defectuosas. Considerando la variable como una variable continua, 12 o más herra¬ 
mientas significa 11.5 o más. 

x = (2% de 400) = 8 y a = s/Ñpc¡ = J (400)(0.02)(0.98) = 2.8 

Entonces, 11.5 en unidades estándar = (11.5 - 8)/2.8 = 1.25, y como se encontró antes, la probabilidad buscada es 
0.1056. 

b) (0.02 + 0.00125) en unidades estándar = + ° o °^ 5 —= 0.18 

Probabilidad buscada = (área bajo la curva normal a la izquierda dez = 0.18) 

= 0.5000 + 0.0714 = 0.5714 

Si no se usa la corrección, se obtiene 0.5000. También se puede usar el segundo método del inciso a). 


8.10 Como resultado de una elección se observa que determinado candidato obtuvo 46% de los votos. Determinar 
la probabilidad de que en una encuesta realizada a: a) 200 y b) 1 000 personas elegidas al azar de la población 
de votantes se hubiera obtenido una mayoría de votos a favor de este candidato. 

SOLUCIÓN 


a) 


fip = p = 0.46 y 



(0.46) (0.54) 


200 


0.0352 


Como 1/2N = 1/400 = 0.0025, se tiene una mayoría en la muestra si la proporción a favor de este candidato es 0.50 
+ 0.0025 = 0.5025 o más. (Esta proporción puede obtenerse también observando que una mayoría es 101 o más, pero 
considerada como variable continua esto corresponde a 100.5, con lo que la proporción es 100.5/200 = 0.5025.) 

0.5025 en unidades estándar = — —= 1.21 


Probabilidad buscada = (área bajo la curva normal a la derecha dez = 1.21) 
= 0.5000 - 0.3869 = 0.1131 


b ) 


= p = °- 46 y 


fñ = /(0.46)(0.54) 

V N V 1 000 


0.0158 


n , no , ... ., , 0.5025 -0.46 

0.5025 en unidades estándar = — - — = 2.69 

Probabilidad buscada = (área bajo la curva normal a la derecha dez = 2.69) 
= 0.5000 - 0.4964 = 0.0036 


DISTRIBUCIÓN MUESTRAL DE DI FE RE NCI AS Y DE SUM AS 

8.11 Sea U 1 una variable que representa los elementos de la población 3, 7, 8 y U 2 una variable que representa los 
elementos de la población 2, 4. Calcular: a) ¡i ul , b) yt u2 , c) fj-ui. u2 ,d) cr ul , e) <r u2 y f) cr ül _ U2 . 

SOLUCIÓN 

a) fi ul = media de la población [7 x = i(3 + 7 + 8) = 6 

b) y i u2 = media de la población U 2 = \(2 + 4) = 3 
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c) Esta población consta de todas las diferencias entre los miembros de U 1 y U 2 , que es 

3-2 7-2 8-2 156 

o 

3-4 7-4 8-4 -1 3 4 


Por lo tanto, 


,. , . , 1 + 5 + 6 + (—1) + 3 + 4 

Hm-m = media de (U x - U 2 ) = - 7 — -= 3 


d) 


Esto ilustra o¡^^v\-u2 = Mt/i - A 4 m< como se ve en los incisos a) y b). 

2 ■ , | ., ., TJ (3 — 6) 2 + (7 — 6) 2 + (8 — 6) 2 14 

<r m = varianza de la población U x =- - -—-— = — 


o bien 




e) 

f) 


(j\j 2 = varianza de la población U 2 = 


(2 - 3) 2 + (4 - 3) 2 


= 1 o bien (t u 2 = 1 


= varianza de la población (U 1 U 2 ) 


(1 - 3) + (5 - 3) + (6 — 3)“ + (—1 — 3) + (3 - 3) 2 + (4 - 3) 2 _ 17 

6 


&UI-U2 — 


17 

3“ 


Esto ilustra que para muestras Independientes a m _ u2 = como se ve en los incisos d) y e). 


8.12 El tiempo medio de vida de los focos del fabricante/! es 1 400 horas (h) y su desviación estándar es 200 h, en 
tanto que el tiempo medio de vida de los focos del fabricante B es 1 200 h y su desviación estándar es 100 h. 
Si se prueban muestras aleatorias de 125 focos de cada fabricante, ¿cuál es la probabilidad de que el tiempo 
medio de vida de los focos del fabricante/! sea por lo menos: a) 160 h y b) 250 h mayor que el del fabricante 

e? 


SOLUCIÓN 

Sean X A y X B los tiempos medios de vida en las muestras de A y de 6, respectivamente. Entonces 


A 1 x A -x B — A 4 x A ~ A 4 .?,, — 1 400 — 1 200 — 200 h 


_ / °A , °B _ 

Ñ~ A + Ñ¡~ 


( 100 )- 

125 




La variable estandarizada que corresponde a la diferencia entre las medias es 

(X A - X B ) - (a ix A -x B ) (X A - X B ) - 200 


VXa-Xr 


20 


que está distribuida casi normalmente. 

a) La diferencia de 160 h en unidades estándar es (160 - 200)/20 = -2. Por lo tanto 

Probabilidad buscada = (área bajo la curva normal a la derecha dez = -2) 
= 0.5000 + 0.4772 = 0.9772 

b) La diferencia de 250 h en unidades estándar es (250 - 200)/20 = 2.50. Por lo tanto 

Probabilidad buscada = (área bajo la curva normal a la derecha dez = 2.50) 
= 0.5000 - 0.4938 = 0.0062 
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8.13 Los balines de determinada marca tienen un peso promedio de 0.50 g y su desviación estándar es 0.02 g. ¿Cuál 
es la probabilidad de que entre dos lotes, cada uno de 1 000 balines, haya una diferencia de peso demás de 2 g? 

SOLUCIÓN 


Sean X ¡y X 2 las medias de los pesos de los balines de los dos lotes. Entonces 

Mr, x 7 = Mr, — Mr, = 0-50 — 0.50 = 0 


ox x = \¡— + — = 
r,-r 2 A/ íVj Ar 2 


( 0 . 02) 2 ( 0 . 02) 2 


1 000 1 000 

La variable estandarizada correspondiente a la diferencia entre las medias es 

_(X l -X 2 )-0 

0.000895 


= 0.000895 


que está distribuida en forma aproximadamente normal. 

U na diferencia de 2 g entre los lotes es equivalente a una diferencia de 2/1 000 = 0.002 g entre las medias. Esto 
puede ocurrir si X¡ - X 2 > 0.002 o si X¡ - X 2 < -0.002; es decir, 


0.002 - 0 
Z - 0.000895 


2.23 o 


-0.002 - O 
“ 0.000895 


-2.23 


Entonces Pr{z > 2.23 o z< -2.23} = Pr{z > 2.23} + Pr{z < -2.23} = 2(0.5000 - 0.4871) = 0.0258. 


8.14 A y B juegan un partido que consiste en que cada uno lance 50 monedas. A gana el partido si obtiene 5 o más 
caras que B; si no, B lo gana. Determinar las posibilidades en contra deque/1 gane un juego. 

SOLUCIÓN 

Sean P A y P B las proporciones de caras obtenidas por A y por 6, respectivamente. Si se supone que las monedas no están 
cargadas, la probabilidad p de obtener una cara es}. Entonces 

PPa-Pb = P’Pa ~ Pp b = 0 


y 


a p A -p¡ 




'P9_ + M_ 
N a N b 



0.10 


La variable estandarizada correspondiente a esta diferencia entre las proporciones esz = (P A -P B - 0J/0.10. 
Considerando la variable como variable continua, 5 o más caras corresponde a 4.5 o más caras, de manera que la 
diferencia entre las proporciones debe ser de 4.5/50 = 0.09 o más; es decir, z es mayor o igual a (0.09 - 0J/0.10 = 0.9 (o 
bien z > 0.9). La probabilidad de esto es el área bajo la curva normal a la derecha dez = 0.9, la cual es (0.5000 - 0.3159) 
= 0.1841. 

De manera que las posibilidades en contra de que4 gane son (1 - 0.1841):0.1841 = 0.8159:0.1841, o 4.43 a 1. 


8.15 Dos distancias se miden como 27.3 centímetros (cm) y 15.6 cm con desviaciones estándar (errores estándar) 
de 0.16 y 0.08 cm, respectivamente. Determinar la media y la desviación estándar de: a) la suma y b) la dife¬ 
rencia de estas distancias. 

SOLUCIÓN 

Si las distancias se denotan D 1 y D 2 , entonces: 

a) M D1+D2 = Mfli + Mzj 2 = 27.3 + 15.6 = 42.9 cm 

°z>i+z >2 = \j&DI + 0£>2 = \/(0.16) - + (0.08)“ = 0.18cm 

b) Mz>i—z >2 = Mdi ~ Mz >2 = 27.3 — 15.6 =11.7 cm 

a D\-Di = \j + °~b2 = ^(0.16)" -I- (0.08)“ = 0.18 cm 
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8.16 La media del tiempo de vida de determinado tipo de foco es 1 500 h y la desviación estándar es 150 h. Se 
conectan tres de estos focos de manera que cuando uno se funda, otro empiece a funcionar. Suponiendo que los 
tiempos de vida estén distribuidos normalmente, ¿cuál es la probabilidad de que la iluminación dure: a) por lo 
menos 5 000 h y b) a lo mucho 4 200 h? 

SOLUCIÓN 


Suponga que los tiempos de vida son L v L 2 y L 3 . Entonces 

Mli+l2+l3 = Mli + /Tí.2 + PL3 = 1 500 + 1 500 + 1 500 = 4 500 h 

°L\+L2+L3 = \J a Ll + a L2 + a L3 = \/ 3 ( 150 ) 2 = 260 h 


a) 


b) 


50 000 h en unidades estándar =--— = 1.92 

260 

Probabilidad buscada = (área bajo la curva normal a la derecha dez = 1.92) 

= 0.5000 - 0.4726 = 0.0274 

4 200 - 4 500 

4 200 h en unidades estándar =-= —1.15 

260 

Probabilidad buscada = (área bajo la curva normal a la izquierda dez = -1.15) 
= 0.5000 - 0.3749 = 0.1251 


DEMOSTRACIONES DE LA TEORÍA EL EM ENTAL DEL MUESTREO 
EM PLEANDO SOFTWARE 

8.17 En una universidad, 1/3 de los estudiantes toma 9 horas de crédito, 1/3 toma 12 horas de crédito y 1/3 toma 
15 horas de crédito. Si X representa las horas de crédito que toma un estudiante, la distribución deX esp(x) = 
1/3 para x = 9,12 y 15. Encontrar la media y la varianza deX. ¿Qué tipo de distribución ti ene X? 

SOLUCIÓN 

La media de X es fi = J2 x p( x ) = 9(1/3) + 12(1/3) + 15(1/3) = 12. La varianza de X es o 2 = £/x 2 /j(x) - /r = 
81(1/3) + 144(1/3) + 225(1/3) - 144 = 150 - 144 = 6. La distribución deX es uniforme. 


8.18 Enumerar todas las muestras de tamaño n = 2 que pueden tomarse (con reposición) déla población del proble¬ 
ma 8.17. Usar el asistente para gráficos de EXCEL para graficar la distribución muestral déla media y mostrar 

que /x ¿ = ¿i y que a\ = o- 2 /2. 

SOLUCIÓN 


A 

B 

C 

D 

E 

F 

G 



media 

x barra 

p(x barra) 

x barra xp(x barra) 

x barra 2 x p 

9 

9 

9 

9 

0.111111 

1 

9 

9 

12 

10.5 

10.5 

0.222222 

2.333333333 

24.5 

9 

15 

12 

12 

0.333333 

4 

48 

12 

9 

10.5 

13.5 

0.222222 

3 

40.5 

12 

12 

12 

15 

0.111111 

1.666666667 

25 

12 

15 

13.5 



12 

147 

15 

9 

12 





15 

12 

13.5 





15 

15 

15 
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La hoja de cálculo de EXCEL muestra en A y en B los valores muéstrales posibles y en C las medias. La distri¬ 
bución muestral dex barra se construye y se da en D y E. En C2 se ingresa la función =AVERAGE(A2:B2), se hace 
clic y se arrastra de C2 a CIO. Como la población es uniforme, cada muestra tiene probabilidad 1/9 de ser elegida. La 
media muestral se representa porx barra. La media de las medias muéstrales es ¡i x = Exp(x) y se calcula de F2 a F6. 
La función =SUM (F2:F6) se ingresa en F7 y se obtiene 12, mostrando que /i x = ¡i. La varianza de las medias mués¬ 
trales es a\ = T,x 2 p(x) - p 2 y se calcula como sigue. DeG2aG6se calcula T,x 2 p(5c). En G7 se ingresa la función 
=SUM (G2:G6), que es igual a 147. Restando 12 2 o blenl44 de 147, se obtiene 3, que es o| = a 2 ¡ 2. En la figura 8-5 
se muestra que con un tamaño de muestra 2, la distribución muestral de x es un poco parecida a una distribución 
normal. Las probabilidades mayores se encuentran cerca de 12 y éstas disminuyen hacia la derecha y hacia la izquierda 
de 12. 



x barra 

Figura 8-5 Distribución dex barra para n =2. 


8.19 E ni ¡star todas las muestras de tamaño n = 3 que se pueden obtener con reposición déla población del problema 
8.17. Usar EXCEL para construir la distribución muestral de la media. Para graf i car la distribución muestral 
de la media se usa el asistente para gráficos de EXCEL. M ostrar que/x^ = /xy quecr? = 


SOLUCIÓN 


A 

B 

C 

D 

E 

F 

G 

H 




media 

x barra 

p(x barra) 

x barra*p(x barra) 

x barra^pfx barra) 

9 

9 

9 

9 

9 

0.037037037 

0.333333333 

3 

9 

9 

12 

10 

10 

0.111111111 

1.111111111 

11.11111111 

9 

9 

15 

11 

11 

0.222222222 

2.444444444 

26.88888889 

9 

12 

9 

10 

12 

0.259259259 

3.111111111 

37.33333333 

9 

12 

12 

11 

13 

0.222222222 

2.888888889 

37.55555556 

9 

12 

15 

12 

14 

0.111111111 

1.555555556 

21.77777778 

9 

15 

9 

11 

15 

0.037037037 

0.555555556 

8.333333333 

9 

15 

12 

12 



12 

146 

9 

15 

15 

13 





12 

9 

9 

10 
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Continuación 


A 

B 

C 

12 

9 

12 

12 

9 

15 

12 

12 

9 

12 

12 

12 

12 

12 

15 

12 

15 

9 

12 

15 

12 

12 

15 

15 

15 

9 

9 

15 

9 

12 

15 

9 

15 

15 

12 

9 

15 

12 

12 

15 

12 

15 

15 

15 

9 

15 

15 

12 

15 

15 

15 


D E 

media x barra 

11 

12 

11 

12 

13 

12 

13 

14 
11 
12 
13 
12 

13 

14 

13 

14 

15 


F 

p(x barra) 


G 

x barra*p(x barra) 


H 

x barra02p(x barra) 


En la hoja de cálculo de EXCEL se muestran en A, B y C todos los valores muéstrales, las medias se dan en D y la 
distribución muestral dex barra se calcula y seda en E y F. En D2 se Ingresa la función =AVERAGE(A2:C2), se hace 
clic y se arrastra desde D2 hasta D28. Como esta población es uniforme, cada muestra tiene la probabilidad 1/27 de 
ser elegida. La media muestral se representa porx barra. La media délas medias muestral es = Y.xpix) y se calcu¬ 
la desde G 2 hasta G8. La función =SUM (G2:G8) se Ingresa en G9y da como resultado 12, lo que demuestra que con 
muestras de tamaño n = 3 /j. x = p. La varianza de las medias muéstrales es cr| = Y,x 2 p(x) - ¡i x y se calcula como 
sigue. Desde H2 hasta H8 se calcula T,x 2 p(x). En H9 se Ingresa la función =SUM (H2:H8), que da como resultado 
146. Restando 12 2 , que es 144, de 146, se obtiene 2. Obsérvese que a\ = a 2 /3. En la figura 8-6 se observa la tenden¬ 
cia de la distribución x barra a una distribución normal. 



x barra 

Figura 8-6 Distribución dex barra para n =3. 


9 


15 





Problemas suplementarios 223 


8.20 Enlistar las 81 muestras de tamaño n = 4 (con reposición) que se pueden obtener de la población del problema 
8.17. Usar EXCEL para construir la distribución muestral de las medias. Con el asistente para gráficos de 
EXCEL, graficar la distribución muestral de las medias, y mostrar que = ¡i y que<r| = <t 2 /4. 

SOLUCIÓN 

El método empleado en los problemas 8.18 y 8.19 se extiende a muestras de tamaño 4. En la hoja de cálculo de EXCEL se 
obtiene la siguiente distribución para x barra. Además, se puede demostrar que n x = /x y que cr 2 = ct 2 /4. 


x barra 

p(x barra) 

x barra*p(x barra) 

x barra ^2p(x bar 

9 

0.012345679 

0.111111111 

1 

9.75 

0.049382716 

0.481481481 

4.694444444 

10.5 

0.12345679 

1.296296296 

13.61111111 

11.25 

0.197530864 

2.222222222 

25 

12 

0.234567901 

2.814814815 

33.77777778 

12.75 

0.197530864 

2.518518519 

32.11111111 

13.5 

0.12345679 

1.666666667 

22.5 

14.25 

0.049382716 

0.703703704 

10.02777778 

15 

0.012345679 

0.185185185 

2.777777778 


1 

12 

145.5 


En la figura 8-7 se muestra la gráfica de EXCEL de la distribución dex barra para muestras de tamaño 4. 



x barra 

Figura 8-7 Distribución dex barra para muestrasden =4. 


PROBLEMAS SUPLEM ENTARIOS 

DISTRIBUCIÓN M UESTRAL DE LAS M EDI AS 

8.21 U na población consta de los cuatro números 3, 7,11 y 15. Considerar todas las posibles muestras con reposición de tama¬ 
ño 2 que pueden obtenerse de esta población. Encontrar: a) la media poblacional, ó) la desviación estándar poblaclonal, 
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c) la media de la distribución muestral de las medias y d) la desviación estándar de la distribución muestral de las medias. 
Verificar los incisos c) y d) directamente a partir de los incisos a) y b) empleando las fórmulas adecuadas. 


8.22 Resolver el problema 8.21 si el muestreo se hace sin reposición. 

8.23 Las masas de 1 500 balines están distribuidas de manera normal, siendo su media 22.40 g y su desviación estándar 0.048 g. 
Si de esta población se toman 300 muestras aleatorias de tamaño 36, determinar la media y la desviación estándar esperadas 
en la distribución muestral de las medias si el muestreo se hace: a) con reposición y b ) sin reposición. 

8.24 Resolver el problema 8.23 si la población consta de 72 balines. 

8.25 ¿En cuántas de las muestras aleatorias del problema 8.23 la media: a) estará entre 22.39 y 22.41 g, b ) será mayor a 22.42 g, 
c) será menor a 22.37 g y d ) será menor a 22.38 g o mayor a 22.41 g? 


8.26 La media de la vida útil de ciertos cinescopios fabricados por una empresa es 800 h y la desviación estándar es 60 h. Encontrar 
la probabilidad de que en una muestra aleatoria de 16 cinescopios la media del tiempo de vida: a) esté entre 790 y 810 h, 
b) sea menor a 785 h, c) sea mayor a 820 h y d) esté entre 770 y 830 h. 

8.27 Repetir el problema 8.26 con una muestra aleatoria de 64 cinescopios. Explicar la diferencia. 

8.28 Los paquetes que se reciben en una tienda departamental pesan en promedio 300 libras (Ib) y su desviación estándar es de 
50 Ib. ¿Cuál es la probabilidad de que 25 paquetes recibidos al azar pesen más del límite de seguridad especificado en el 
elevador, que es 8 200 Ib? 

NÚMEROSALEATORIOS 

8.29 Repetir el problema 8.6 usando un conjunto diferente de números aleatorios y seleccionando: a) 15, b) 30, c) 45 y d) 60 
muestras, con reposición, de tamaño 4. En cada caso, comparar con los resultados teóricos. 

8.30 Repetir el problema 8.29 tomando muestras de tamaño: a) 2 y ó) 8 con reposición, en lugar de tamaño 4 con reposición. 

8.31 Repetir el problema 8.6, pero muestreando sin reposición. Comparar con los resultados teóricos. 

8.32 a) M ostrar cómo se toman 30 muestras de tamaño 2 de la distribución del problema 3.61. 

b) Calcular la media y la desviación estándar de la distribución muestral de las medias obtenida y compararla con los 
resultados teóricos. 

8.33 Repetir el problema 8.32 empleando muestras de tamaño 4. 

DISTRIBUCIÓN MUESTRAL DE PROPORCIONES 

8.34 Encontrar la probabilidad de que de los 200 próximos niños que nazcan, a) menos de 40% sean varones, b ) entre43 y 57% 
sean niñas y c) más de 54% sean varones. Supóngase que existe la misma probabilidad de nacimiento de un niño que de 
una niña. 

8.35 De 1 000 muestras, cada una de 200 niños, ¿en cuántas puede esperarse encontrar que: a) menos del 40% sean niños, 
b) entre 40 y 60% sean niñas y c) 53% o más sean niñas? 
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8.36 Repetir el problema 8.34 si las muestras son de 100 y no de 200 niños y explicar las diferencias resultantes. 


8.37 U na urna contiene 80 canicas, de las cuales el 60% son rojas y el 40% son blancas. De 50 muestras, cada una de 20 canicas, 
tomadas de la urna con reposición, ¿en cuántas muestras se puede esperar que: a) haya el mismo número de canicas rojas 
que de canicas blancas, b) haya 12 canicas rojas y 8 canicas blancas, c) haya 8 canicas rojas y 12 canicas blancas y cf) 10 
o más canicas sean blancas? 


8.38 Diseñar un experimento que tenga por objeto ilustrar los resultados del problema 8.37. En lugar de canicas rojas y blancas 
se pueden usar tiras de papel en las que se escriba R y B en las proporciones adecuadas. ¿Qué error se introduciría al usar 
dos conjuntos diferentes de monedas? 


8.39 U n fabricante envía 1 000 lotes, cada uno de 100 bulbos eléctricos. Si es normal que el 5% de los bulbos esté defectuoso, 
¿en cuántos de los lotes se esperaría: a) menos de 90 bulbos buenos y ó) 98 o más bulbos buenos? 


DISTRIBUCIONES MUESTRALES DE DIFERENCIA Y DE SUMAS 

8.40 A y B fabrican cables que tienen una resistencia media a la ruptura de 4 000 Ib y 4 500 Ib, y desviaciones estándar de 300 
Ib y 200 Ib, respectivamente. Si se prueban 100 cables del fabricante /A y 50 cables del fabri cante B, ¿cuál es la probabilidad 
deque la resistencia media a la ruptura deB sea: a) por lo menos 600 Ib mayor que la de4 y b) por lo menos450 Ib mayor 
que la de4? 


8.41 En el problema 8.40, ¿cuáles son las probabilidades si se prueban 100 cables de cada fabricante? Explicar cualquier dife¬ 
rencia. 


8.42 La puntuación media obtenida por los estudiantes en una prueba de aptitud es 72 puntos y la desviación estándar es 8 pun¬ 
tos. ¿Cuál es la probabilidad de que dos grupos de estudiantes, uno de 28 y otro de 36 estudiantes, difieran en la media de 
sus puntuaciones en: a) 3 o más puntos, Ib) 6 o más puntos y c) entre 2 y 5 puntos? 


8.43 U na urna contiene 60 canicas rojas y 40 canicas blancas. De esta urna se extraen, con reposición, dos conjuntos de 30 
canicas cada uno, y se van anotando sus colores. ¿Cuál es la probabilidad de que los dos conjuntos difieran en 8 o más 
canicas rojas? 


8.44 Resolver el problema 8.43 si para obtener los dos conjuntos de canicas el muestreo se hace sin reposición. 


8.45 Los resultados de una elección indican que un candidato obtuvo el 65% de los votos. Encontrar la probabilidad de quedos 
muestras aleatorias, cada una de 200 votantes, indiquen una diferencia mayor al 10% entre las proporciones de quienes 
votaron por el candidato. 


8.46 Si U 2 y 17 2 son los conjuntos de números del problema 8.11, verificar que: a) fi m+U2 = nui + Huí Y ó) cr m+U2 = 

\J°V\ +°U2- 

8.47 Los valores que se obtienen al medir tres masas son 20.48,35.97 y 62.34 g, con desviaciones estándar de 0.21, 0.46 y 0.54 g, 
respectivamente. Encontrar: a) la media y b ) la desviación estándar de la suma de las masas. 


8.48 El voltaje medio de una batería es 15.0 volts (V) y la desviación estándar es 0.2 V. ¿Cuál es la probabilidad de que cuatro 
de estas baterías conectadas en serie tengan, juntas, un voltaje de 60.8 V o más? 
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DEMOSTRACIONES DE LA TEORÍA E L E M E NTAL DEL MUESTREO EMPLEANDO SOFTWARE 
8.49 En una universidad la distribución de las horas crédito es como sigue: 


X 

6 

9 

12 

15 

18 

plx) 

0.1 

0.2 

0.4 

0.2 

0.1 


Encontrar ¡j, y a 2 . Dar las 25 muestras (con reposición) de tamaño 2 que se pueden obtener, su media y sus probabilidades. 

8.50 Graf¡car la distribución de probabilidad dex barra del problema 8.49, para n = 2. 

8.51 Con los datos del problema 8.50, mostrar que = n y a\ = y. 

8.52 Con los datos del problema 8.49, proporcionar y graficar la distribución de probabilidad dex barra para n = 3. 
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TEORÍA DE 
LA ESTIMACIÓN 
ESTADÍSTICA 


ESTIMACIÓN DE PARÁMETROS 

En el capítulo 8 se vio cómo emplear la teoría del muestreo para obtener Información acerca demuestras extraídas en 
forma aleatoria de una población desconocida. Sin embargo, desde el punto de vista práctico, suele ser más importan¬ 
te poder Inferir Información acerca de una población a partir de muestras obtenidas de ella. De estos problemas se 
ocupa la inferencia estadística en la que se usan los principios de la teoría del muestreo. 

Un problema importante de la Inferencia estadística es la estimación d e parámetros poblacionates, o simplemente 
parámetros (como, por ejemplo, la media y la varianza poblacionales), a partir de los correspondientes estadísticos 
muéstrales, o simplemente estadísticos (por ejemplo, la media y la varianza muéstrales). En este capítulo se analiza 
este problema. 

ESTIMACIONES IN SESGA DAS 

SI la media déla distribución muestral de un estadístico es igual al parámetro poblaclonal correspondiente se dice que 
el estadístico es un estimador insesgado del parámetro; si no es así, se dice que es un estimador sesgado. A los valores 
de estos estadísticos se les llama estimaciones insesgadas o sesgadas, respectivamente. 

EJEMPLO 1 La media de la distribución muestral de las medias ¡j, x es ¡i, la media poblacional. Por lo tanto, la media muestral 
X es una estimación insesgada de la media poblacional 


EJEMPLO 2 La media de la distribución muestral de las varianzas es 


donde a 2 es la varianza poblacional y N es el tamaño de la muestra (ver tabla 8.1). Por lo tanto, la varianza muestral s 2 es una esti¬ 
mación sesgada de la varianza poblacional a 2 . Empleando la varianza modificada 


-2 _ AT 2 
‘ S ~ N-l S 


se encuentra que /x¿a = o 2 , de manera queí 2 es una estimación insesgada dea 2 . Sin embargo, $ es una estimación sesgada de a. 
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En el lenguaje de la esperanza matemática (ver capítulo 6) se puede decir que un estadístico es ¡nsesgado si su 
esperanza matemática es igual al correspondiente parámetro poblacional. Por lo tanto, X y s 2 son ¡nsesgados, ya que 

E{X} = ¡i y E{s 2 } = a 1 . 

ESTIM ACIONES EFICIENTES 

Si la distribución muestral dedos estadísticos tiene la misma media (o esperanza), entonces al estadístico que tiene la 
menor varlanza se le llama estimador eficiente del parámetro correspondiente, y al otro se le llama estimador inefi¬ 
ciente. A los valores de estos estadísticos se les llama estimaciones eficientes e ineficientes, respectivamente. 

SI se consideran todos los estadísticos cuya distribución muestral tiene una misma media, al estadístico que tiene 
la menor varlanza suele IIamársele estimador más eficiente o mejor del parámetro correspondiente. 

EJEMPLO 3 Las distribuciones muéstrales de la media y de la mediana tienen la misma media, a saber, la media pobl acional. 
Sin embargo, la varianza de la distribución muestral de las medias es menor que la varianza de la distribución muestral de las 
medianas (ver tabla 8.1). Por lo tanto, la media muestral proporciona una estimación eficiente de la media pobl acional, en tanto que 
la mediana muestral proporciona una estimación ineficiente de la media poblad onal. 

De todos los estadísticos que estiman la media poblacional, la media muestral proporciona la mejor (o la más eficiente) estima¬ 
ción. 

En la práctica, las estimaciones Ineficientes suelen usarse debido a la relativa facilidad con que algunas de ellas 
pueden obtenerse. 

ESTIMACIONES PUNTUALESY ESTIMACIONES POR INTERVALO; 

SU CONFIABILIDAD 

A una estimación de un parámetro poblacional que se da mediante un solo número se le llama estimación puntual del 
parámetro. A una estimación de un parámetro poblacional que se da mediante dos números, entre los cuales se consi¬ 
dera que debe estar el parámetro en cuestión, se le llama estimación por intervalo del parámetro en cuestión. 

Las estimaciones por Intervalo dan la precisión, o exactitud, de la estimación, y por esto se prefieren a las estima¬ 
ciones puntuales. 

EJEMPLO 4 Si se dice que en la medición de una distancia se obtuvo como resultado 5.28 metros (m), se está dando una esti¬ 
mación puntual. En cambio, si se dice que la distancia es 5.28 ± 0.03 m (es decir, que la distancia está entre 5.25 y 5.31 m), se está 
dando una estimación por intervalo. 

La información sobre el error (o precisión) de una estimación es su confiabilidad. 

ESTIMACIÓN DE PARÁM ETROS POBL ACIONAL E S M EDI ANTE 
UN INTERVALO DE CONFIANZA 

Sean y <r s la media y la desviación estándar (error estándar), respectivamente, de la distribución muestral de un 
estadístico 5. Entonces, si la distribución muestral deS es aproximadamente normal (lo que se sabe que es así para 
muchos estadísticos si el tamaño de la muestra es N > 30), se puede esperar que exista un estadístico muestral S que 
se encuentre en los Intervalos p. s - a s a p. s + a s , y¿ s - 2er s a p s + 2a s o p s - 3 <j s a p s + 3 <j s , a 68.27%, 95.45% y 
99.73% de las veces, respectivamente. 

De Igual manera, se puede hallar (o se puede tener confianza de hallar) p. s en los Intervalos 5 - cr s aS + cr s , S - 
2a s a S + 2er s o S - 3er s a S + 3tr s a 68.27, 95.45 y 99.73% de las veces, respectivamente. Debido a ello, a estos 
Intervalos se les llama intervalos de confianza de 68.27%, 95.45% y 99.73% para estimar n s . A los números de los 
extremos de estos Intervalos (S ± a s , S ± 2o- s y S ± 3cr s ) se les llama límites de confianza o límites fiduciales. 

De Igual manera, S ± 1.96cr s y 5 ± 2.58cr s son los límites de confianza de 95% y de 99% (o de 0.95 y 0.99) para 
S. AI porcentaje de confianza se le suele llamar nivel de confianza. A los números 1.96, 2.58, etc., que aparecen en los 
límites de confianza, se les llama coeficientes de confianza o valores críticos y se denotan z c . A partir de los niveles de 
confianza se pueden encontrar los coeficientes de confianza y viceversa. 
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En la tabla 9.1 se presentan los valores dez c que corresponden a varios niveles de confianza que se usan en la 
práctica. Los valores de z c para niveles de confianza que no estén en esta tabla se pueden encontrar en las tablas de 
áreas de la curva normal (ver apéndice II). 


Tabla 9.1 


Nivel de confianza 

99.73% 

99% 

98% 

96% 

95.45% 

95% 

90% 

80% 

68.27% 

50% 


3.00 

2.58 

2.33 

2.05 

2.00 

1.96 

1.645 

1.28 

1.00 

0.6745 


I ntervalos de confianza para las medias 

SI el estadísticos es la media muestral X, entonces los límites de confianza de 95 y 99% para la estimación déla media 
poblacional /x están dados por X ± 1.960* y X ±2.58o*, respectivamente. En general, los límites de confianza están 
dados por X ± z c ax, donde z c (que depende del nivel de confianza deseado) puede leerse en la tabla 9.1. Empleando 
los valores para o-* obtenidos en el capítulo 8, se ve que los límites de confianza para la media poblacional están dados 
por 


X±z c 


G 

VÑ 


( 1 ) 


si el muestreo se hace ya sea de una población infinita o de una población finita, pero con reposición, y están dados 
por 


X ±z c 


G 

y[Ñ 



( 2 ) 


si el muestreo se hace sin reposición de una población de tamaño finito N p . 

Por lo general no se conoce la desviación estándar poblacional a; de manera que para obtener los límites de con¬ 
fianza anteriores, se usa la estimación muestral ios. El resultado es satisfactorio si N > 30. SI N < 30, la aproximación 
es pobre y se debe emplear la teoría del muestreo para muestras pequeñas (ver capítulo 11). 


Intervalos de confianza para proporciones 


Si el estadístico S es la proporción de "éxitos" en una muestra de tamaño N obtenida de una población binomial en la 
que p es la proporción de éxitos (es decir, la probabilidad de éxito), entonces los límites de confianza para p están 
dados por P ± z c a p , donde P es la proporción de éxitos en una muestra de tamaño N. Empleando los valores para a p 
Indicados en el capítulo 8 se ve que los límites de confianza para la proporción poblacional están dados por 


P ± z r 



( 3 ) 


si el muestreo se hace de una población Infinita o de una población finita, pero con reposición, y están dados por 


P±z c 


¡pq K-n 

V n y n p -1 


(4) 


si el muestreo se hace sin reposición y de una población finita de tamaño N p . 

Para calcular estos límites de confianza se emplea la estimación muestral P para p, la que por lo general resulta 
satisfactoria siempre que N > 30. En el problema 9.12 se da un método más exacto para obtener estos límites de 
confianza. 
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I ntervalos de confianza para diferencias y sumas 


Si S x y S 2 son dos estadísticos muéstrales con distribuciones aproximadamente normales, los límites de confianza para 
la diferencia entre los parámetros poblacionales correspondientes a S : y S 2 están dados por 

Si — S 2 ± z c a Sl _s 2 = Si — S 2 ± z c yjOg t + a^ 2 (5) 

y los límites de confianza para la suma de los parámetros poblacionales están dados por 


Si + S 2 ± z c a Sl+S2 — S¡ + S 2 ± z c 



+ o 


2 

Si 


( 6 ) 


siempre que las muestras sean Independientes (ver capítulo 8). 

Por ejemplo, los límites de confianza para la diferencia entredós medias poblacionales, en el caso en que las pobla¬ 
ciones sean infinitas, están dados por 


X¡ — X 2 ± z c a x l -x 2 — X\ — X 2 ±z c 



(7) 


donde X u a 1 , N 1 y X 2 , a 2 > N 2 son l as correspondientes medias, desviaciones estándar y tamaños de las dos muestras 
obtenidas de las poblaciones. 

De igual manera, los límites de confianza para la diferencia entre dos proporciones poblacionales, si las poblacio¬ 
nes son Infinitas, están dados por 


P 1 - P 2 ± - C Cr P ,-/> 2 


Pl ~ Pl ± Z r 


Pi(i -Pl) , ^ 2 (1 -Pl) 


Ni 


N 2 


( 8 ) 


donde P 2 y P 2 son las dos proporciones muéstrales, N 2 y N 2 son los tamaños de las dos muestras obtenidas de las 
poblaciones y p 1 y p 2 son las proporciones en las dos poblaciones (estimadas porPj y P 2 ). 


Intervalos de confianza para desviaciones estándar 

Los límites de confianza para la desviación estándar o- de una población distribuida normalmente, estimada a partir de 
una muestra con desviación estándar s, están dados por 


(7 ... 

s ± z r a . — s±z r ,— (9) 

V2Ñ 

empleando la tabla 8.1. Para calcular estos límites de confianza, se usa so.? para estimar a. 

ERROR PROBABLE 

Los límites de confianza de 50% para el parámetro poblacional correspondiente a un estadístico S están dados por 
S ± 0.6745cr s . La cantidad 0.6745er s se conoce como el error probable de la estimación. 
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PROBLEMAS RESUELTOS 

ESTIMADORES IN SE SG A DO SY EFICIENTES 

9.1 Darun ejemplo de estimadores (o estimaciones) quesean: a) insesgados y eficientes, b) i nsesgadose ineficien¬ 
tes y c) sesgados e ineficientes. 

SOLUCIÓN 

a) La media muestral X y la varianza muestral 


son dos ejemplos. 

b ) La mediana muestral y el estadístico muestral i(gi + Q 3 ), donde Qj y Q 3 son los cuartiles muéstrales inferior y 
superior, son dos de estos ejemplos. A mbos estadísticos son estimaciones insesgadas de la media poblacional, ya que 
la media de sus distribuciones muéstrales es la media poblacional. 

c) La desviación estándar s, la desviación estándar modificada S, la desviación media y el rango semiintercuartiI son 
cuatro de estos ejemplos. 

9.2 Para el diámetro de un esfera, un científico obtiene una muestra de cinco mediciones, 6.33, 6.37, 6.36, 6.32 y 
6.37 centímetros (cm). Obténganse estimaciones insesgadas y eficientes de: a) la verdadera media y b) la ver¬ 
dadera varianza. 

SOLUCIÓN 

a) La estimación insesgada y eficiente de la verdadera media (es decir, de la media poblacional) es 

X _T, X _ 6-33 + 6.37 + 6.36 + 6.32 + 6.37 _ cm 
N 5 

b) La estimación insesgada y eficiente de la verdadera varianza (es decir de la varianza poblacional) es 

~2 _ 2 _ Y.{X-X) 2 

N- 1 N— 1 

_ (6.33 - 6.35) 2 + (6.37 - 6.35) 2 + (6.36 - 6.35) 2 4- (6.32 - 6.35) 2 + (6.37 - 6.35) 2 
“ 5- 1 

= 0.00055 cm 2 

Obsérvese que aunque i = \/0.00055 = 0.023 cm es una estimación de la verdadera desviación estándar, esta 
estimación no es ni insesgada ni eficiente. 

9.3 Supóngase que las estaturas de 100 estudiantes varones de la universidad XYZ representan una muestra alea¬ 
toria de las estaturas de los 1 546 estudiantes de esa universidad. Determinar estimaciones insesgadas y eficien¬ 
tes: a) para la verdadera media y b) para la verdadera varianza. 

SOLUCIÓN 

a) De acuerdo con el problema 3.22, la estimación insesgada y eficiente de la verdadera estatura media es X = 67.45 
pulgadas (in). 

b ) De acuerdo con el problema 4.17, la estimación insesgada y eficiente de la verdadera varianza es 

.5 2 = ^ T /=^ ) (8.5275) = 8.6136 


Por lo tanto, s = \/8.6136 = 2.93in. Obsérvese que como N es grande, en esencia no hay diferencia entres 2 y r o 
entre s y.?. 
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Obsérvese que no se empleó la corrección deSheppard por agrupamiento. Si se emplea, se usas = 2.79 in (ver 
problema 4.21). 


9.4 Dar una estimación insesgada e ineficiente del verdadero diámetro medio de la esfera del problema 9.2. 

SOLUCIÓN 

La mediana es un ejemplo de estimación insesgada e ineficiente de la media poblacional. Para las cinco mediciones coor¬ 
denadas de acuerdo con su magnitud, la mediana es 6.36 cm. 


INTERVALOS DE CONFIANZA PARA MEDIAS 

9.5 Encontrar los intervalos de confianza: a) de 95% y b) 99% para estimar la estatura media de los estudiantes de 
la universidad XYZ del problema 9.3. 

SOLUCIÓN 

a) Los límites de confianza del 95% son X ± \.96tj/\/Ñ. Empleando X = 67.45in, y .? = 2.93in como estimación de 
a (ver problema 9.3), los límites de confianza son 67.45 ± 1.96(2.93/vT00) o 67.45 ± 0.57 in. Por lo tanto, el inter¬ 
valo de confianza del 95% para la media poblacional /i es 66.88 a 68.02 in, lo que se denota así 66.88 < n < 68.02. 

De manera que se puede decir que la probabilidad de que la media poblacional de las estaturas se encuentre 
entre 66.88 y 68.02 es aproximadamente de 95% o 0.95. Empleando símbolos se escribe Pr{66.88 < n < 68.02} = 
0.95. Esto equivale a decir que se tiene 95% de confianza en que la media poblacional (o verdadera media) se encuen¬ 
tre entre 66.88 y 68.02 in. 

b) Los límites de confianza del 99% son X ± 2.58(t/v / ÍV = X ± 2.5SS/VÑ = 67.45 ± 2.58(2.93/vT00) = 67.45 ± 
0.76 in. Por lo tanto, el intervalo de confianza del 99% para la media poblacional ¿¿ es 66.69 a 68.21 in, lo que se 
denota así 66.69 < /x < 68.21. 

Al obtener los intervalos de confianza anteriores se supuso que la población era infinita o tan grande que se 
podía considerar que las condiciones eran las mismas que en un muestreo con reposición. En el caso de poblaciones 
finitas, si el muestreo se hace sin reposición, se debe usar 


_o_ ¡ N p - N 
VÑ\J N p -l 


en lugar de 


(7 

VÑ 


Sin embargo, se puede considerar que el factor 



1 546 


1 546 


100 


0.967 


es prácticamente 1.0, por lo que no necesita usarse. Si se usa, los límites de confianza anteriores se convierten en 67.45 
± 0.56 in y 67.45 ± 0.73 in, respectivamente. 


9.6 Una empresa tiene 5 000 árboles de navidad maduros y listos para ser cortados y vendidos. En forma aleatoria 
se seleccionan 100 de estos árboles y se miden sus alturas. En la tabla 9.2 se dan estas alturas en pulgadas. 
Emplear M INITAB para dar un Intervalo de confianza de 95% para la altura media de los 5 000 árboles. SI 
estos árboles se venden a $2.40 por pie, dar un límite Inferior y un límite superior para el valor de los 5 000 
árboles. 

SOLUCIÓN 

El intervalo de confianza de M INITAB, que se da a continuación, indica que la altura media de los 5 000 árboles puede ir 
desde 57.24 a 61.20 pulgadas. El número total de pulgadas en los 5 000 árboles está entre (57.24)(5 000) = 286 200 y 
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Tabla 9.2 


56 

61 

52 

62 

63 

34 

47 

35 

44 

59 

70 

61 

65 

51 

65 

72 

55 

71 

57 

75 

53 

48 

55 

67 

60 

60 

73 

74 

43 

74 

71 

53 

78 

59 

56 

62 

48 

65 

68 

51 

73 

62 

80 

53 

64 

44 

67 

45 

58 

48 

50 

57 

72 

55 

56 

62 

72 

57 

49 

62 

46 

61 

52 

46 

72 

56 

46 

48 

57 

52 

54 

73 

71 

70 

66 

67 

58 

71 

75 

50 

44 

59 

56 

54 

63 

43 

68 

69 

55 

63 

48 

49 

70 

60 

67 

47 

49 

69 

66 

73 


(61.20)(5 000) = 306 000. Si estos árboles se venden a $2.40 por pie, entonces el precio por pulgada es $0.2. El valor de 
los árboles está entre (286 000)(0.2) = $57 200 y (306 000)(0.2) = $61 200 con 95% de confianza (o de seguridad). 


Despliege de datos 
al tura 


56 

70 

53 

71 

73 

50 

46 

54 

44 

48 

61 

61 

48 

53 

62 

57 

61 

73 

59 

49 

52 

65 

55 

78 

80 

72 

52 

71 

56 

70 

62 

51 

67 

59 

53 

55 

46 

70 

54 

60 

63 

65 

60 

56 

64 

56 

72 

66 

63 

67 

34 

72 

60 

62 

44 

62 

56 

67 

43 

47 

47 

55 

73 

48 

67 

72 

46 

58 

68 

49 

35 

71 

74 

65 

45 

57 

48 

71 

69 

69 

44 

57 

43 

68 

58 

49 

57 

75 

55 

66 

59 

75 

74 

51 

48 

62 

52 

50 

63 


73 

MTB > el desviación estándar 

Columna desviación estándar 

Desviación estándar de altura = 10.111 

MTB > zi nterval o 95% de confianza ds = 10.111 datos en el 

Intervalos de confianza 

Sigma supuesta = 10.1 

Variable N Media DesvEst SE media 9 5.0% CI 

Altura 1 0 0 5 9.2 2 1 0.1 1 1.0 1 ( 5 7.2 4, 6 1.2 0 ) 

En una encuesta a sacerdotes católicos, cada sacerdote Informó de la cantidad de bautizos, bodas y funerales 
celebrados el año anterior. En la tabla 9.3 se presentan las respuestas obtenidas. Utilizar estos datos para cons¬ 
truir un Intervalo de confianza de 95% para /i, la media del número, por sacerdote, de bautizos, bodas y fuñe- 
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Tabla 9.3 


32 

44 

48 

35 

34 

29 

31 

61 

37 

41 

31 

40 

44 

43 

41 

40 

41 

31 

42 

45 

29 

40 

42 

51 

16 

24 

40 

52 

62 

41 

32 

41 

45 

24 

41 

30 

42 

47 

30 

46 

38 

42 

26 

34 

45 

58 

57 

35 

62 

46 


rales celebrados el año anterior. Obtener el intervalo empleando lafórmula para intervalos de confianza y usar 
también el comando Zi n t e r v a I de M INITAB para hallar este intervalo. 

SOLUCIÓN 

U na vez Ingresados los datos de la tabla 9.3 en la columna 1 de la hoja de cálculo de M INITAB y de haberle dado "núme¬ 
ro" como nombre a esta columna, se dan los comandos para la media y la desviación estándar. 

MTB > el medi a 

Columna media 

Media de número = 40.261 
MTB > el desviación estándar 

Columna desviación estándar 

Desviación estándar de número = 9.9895 

El error estándar de la media es igual a 9.9895/\/50 = 1.413, el valor crítico es 1.96 y el margen de error de 95% 
es 1.96(1.413) = 2.769. El intervalo de confianza va de 40.261 - 2.769 = 37.492 a 40.261 + 2.769 = 43.030. 

Con el comando Zi nterval se obtiene el resultado siguiente: 

MTB > Zinterval, de 95% de confianza sd = 9.9895 datos en el 
Intervalos de confianza Z 
Sigma supuesta = 9.99 

Variable N Media DesvEst SE media 9 5.0 0 % CI 
Número 50 40.26 9.99 1.41 (37.49, 43.03) 

Se tiene una confianza de 95% de que la verdadera media de todos los sacerdotes esté entre 37.49 y 43.03. 


9.8 Para medir el tiempo de reacción, un psicólogo estima que la desviación estándar es 0.05 segundos (s). ¿Qué 
tan grande debe ser la muestra de las medidas para que se tenga una confianza: a) de 95% y b) de 99% en que 
el error de esta estimación no será mayor de 0.01 s? 

SOLUCIÓN 

a) Los límites de confianza del 95% son X ± 1.96a/v^V, siendo el error de estimación 1.96<r/\/]v. Tomando a = s = 
0.05 s, se ve que este error será igual a 0.01 s si (1.96)(0.05)/vOv = O.Ol; es decir, y/Ñ = (1.96)(0.05)/O.Ol = 9.8 
o bien N = 96.04. Por lo tanto, se puede tener una confianza del 95% en que el error de estimación será menor a 0.01 
si N es 97 o mayor. 
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Otro método 


(1.96)(0.05) 

VÑ 


< 0.01 


si 


VÑ ^ 1 

(1.96)(0.05) - 0.01 


o bien 


VÑ> 


(1.96) (0.05) 
0.01 


E ntonces N > 96.04, o bien N > 97. 

b) Los límites de confianza del 99% son X ±2.58 a/VÑ. Entonces (2.58)(0.05)/\/Ñ = 0.01 o bien N = 166.4. De 

manera que se puede tener una confianza de 99% de que el error de estimación será menor a 0.01 s sólo si N es 167 
o mayor. 


9.9 De un total de 200 calificaciones de matemáticas se tomó una muestra aleatoria de 50 calificaciones en la que 
la media encontrada fue 75 y la desviación estándar, 10. 

a) ¿Cuáles son los límites de confianza de 95% para la estimación de la media de las 200 calificaciones? 

b) ¿Con qué grado de confianza se puede decir que la media de las 200 calificaciones es 75 ± 1? 

SOLUCIÓN 


a) Como el tamaño de la población no es muy grande en comparación con el tamaño de la muestra, hay que hacer un 
ajuste. Entonces, los límites de confianza de 95% son 


X ± 1.96í7v> = X± 1.96 °L- 
Vn 



= 75 ± 1.96 


10 

\/50 


200 - 50 
200 - 1 


75 ± 2.4 


b ) Los límites de confianza están representados por 


X ±z c ax = X ±: 


VÑ 


N„ — N 


10 

VÑO 


200 - 50 
200-1 


= 75 ± 1.23z 


Como esto debe ser igual a 75 ± 1, se tiene 1.23z c = 1, o bien z c = 0.81. El área bajo la curva normal desde z = 0 
hasta z = 0.81 es 0.2910; por lo tanto, el grado de confianza buscado es 2(0.2910) = 0.582 o bien 58.2%. 


INTERVALOS DE CONFIANZA PARA PROPORCIONES 

9.10 Un sondeo realizado con 100 votantes tomados en forma aleatoria de la población de todos los votantes de 
determinado distrito indica que de éstos, 55% están a favor de cierto candidato. Encontrar límites de confianza 
de: a) 95%, b) 99% y c) 99.73% para la proporción de todos los votantes a favor de este candidato. 

SOLUCIÓN 

a) Los límites de confianza de 95% para la p poblacional son P± 1.96o> = P± 1.96 y/p{ 1 - p)/N = 0.55± 
1.96 y / ((L55)((L45)7T0() = 0.55 ± 0.10, donde se ha usado la proporción muestral P para estimar p. 

b) Los límites de confianza de 99% para p son 0.55 ± 2.58 -v/(0.55)(0.45)/100 = 0.55 ± 0.13. 

c) Los límites de confianza de 99.73% parap son 0.55 ± 3 ^(0.55)(0.45)/100 = 0.55 ±0.15. 

9.11 ¿De qué tamaño deberá tomarse la muestra de votantes del problema 9.19 para tener una confianza de: a) 95% 
y b) 99.73% de que el candidato será electo? 

SOLUCIÓN 

Los límites de confianza parap son P±z c sjp( 1 -p)/N = 0.55 ±z c -y/ (0.55)(0.45)/Ar = 0.55 ± 0.50: C /VÑ, donde, de 
acuerdo con el problema 9.10, se ha usado la estimación P = p = 0.55. Dado que el candidato gana sólo si tiene más del 
50% de la población de votantes, se requiere que 0.50 z c /VÑ sea menor a 0.05. 
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a) Para una confianza de 95%, 0.50 z c ¡sfÑ = 0.50(1.96)/%/ÍV = 0.05 si N = 384.2. Por lo tanto, N debe ser 385, por lo 
menos. 

b ) Para una confianza de 99.73%, 0.50z c /y/Ñ = 0.50(3) /V2V = 0.05 si N = 900. Por lo tanto, N debe ser 901, por lo 
menos. 

Otro método 

1.50/VÑ < 0.05 si \Zfvyi.50 > 1/0.05 o VÑ > 1.50/0.05. Entonces \/Ñ > 30 o bien N > 900, de manera que N 
debe ser por lo menos 901. 


9.12 Se realiza un estudio y se encuentra que 156 de 500 varones adultos son fumadores. Emplear el paquete de 
softwareSTATISTIX para dar un Intervalo de confianza de 99% para p, la proporción poblacional de varones 
adultos que son fumadores. Verificar el Intervalo de confianza calculándolo a mano. 

SOLUCIÓN 

Los resultados de STATISTIX se dan a continuación. El intervalo de confianza de 99% aparece en negritas. 


Prueba de proporción de una muestra 

Tamaño de la muestra 500 
Éxito 156 
Proporción 0.31200 


Hipótesis nula 
Hipótesis alterna 


P = 0. 5 
<>0.5 


Diferencia 
Error estándar 
Z (sin corregir) 
Z (corregida) 


0 . 1 8 8 0 0 
0.02072 

-8.41 P 0.0000 

-8.36 P 0.0000 


Sin corregir 

Corregí do 


Intervalo de confianza 99% 
(0.25863, 0.36537) 

(0.25763, 0.36637) 


Se tiene una confianza de 99% de que el verdadero porcentaje de varones adultos fumadores esté entre 25.9% y 
36.5%. 


Verificación: 


P = 0.312, = 2.58, \/ 0 ' 31 g ( 0 ° 0 688) = 0-0207 


P±z, 


W ~P ) 

N 


o bien 0.312 ± 2.58(0.0207) o bien (0.258, 0.365). Esto es lo mismo que se obtuvo antes con el 


paquete de software STATISTIX. 


9.13 Refiérase al problema 9.12 para dar un Intervalo de confianza de 99% para p empleando M INITAB. 

SOLUCIÓN 

El intervalo de confianza de 99% se muestra abajo en negritas. Es el mismo que el intervalo de confianza obtenido con 
STATISTIX en el problema 9.12. 

Muestra X N Muestra P Cl 99% Valor z Valor P 

1 156 500 0.312000 (0.258629, 0.365371) -8.41 0.000 
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INTERVALOS DE CONFIANZA PARA DIFERENCIAS Y SUMAS 

9.14 Para comparar la cantidad de tiempo que utilizan su celular los estudiantes universitarios, tanto varones como 
mujeres, se tomaron 50 estudiantes varones y 50 estudiantes mujeresy se determinó la cantidad de tiempo, en 
horas por semana, que utilizan su celular. En la tabla 9.4 se presentan los resultados en horas. Dar un Intervalo 
de 95% de confianza para fi 1 ~ n 2 usando M INITAB. Verificar los resultados calculando a mano el Intervalo. 


Tabla 9.4 


Varones 

M ujeres 

12 

4 

11 

13 

11 

11 

9 

7 

10 

9 

7 

9 

10 

10 

7 

10 

10 

7 

9 

10 

7 

12 

6 

9 

15 

11 

8 

9 

6 

11 

10 

11 

12 

7 

8 

10 

7 

9 

12 

14 

8 

9 

11 

10 

9 

11 

12 

12 

8 

12 

10 

9 

9 

7 

9 

12 

9 

10 

11 

7 

11 

7 

10 

10 

11 

12 

7 

9 

8 

11 

9 

12 

12 

8 

13 

10 

8 

13 

8 

10 

9 

10 

8 

11 

10 

9 

9 

9 

11 

9 

13 

13 

9 

10 

13 

9 

8 

9 

12 

11 


SOLUCIÓN 

Dado que ambas muestras son mayores de 30, se puede usar indistintamente la prueba z o la prueba t para dos muestras, ya 
que la distribución ty la distribución z son muy similares. 


Do s 

mu est 

r a 

s T pa 

r a varón 

e s 

v s muj 

eres 






N 

Me di a 

Des v Es t 

SE 

me di a 


va r 

ones 


50 

9.82 


2.15 


0. 30 


mu j 

eres 


50 

9. 70 


1.78 


0.25 


Di f 

er e nci 

a 

= mu ( 

varones) 

- 

mu ( mu 

j e r e s 

) 


Est 

i mado 

pa 

r a d i f 

e r enci a: 

0. 

120000 




Cl 

95% pa 

r a 

di f er 

enci a: ( 

■ 0. 

663474 

, 0. 9 

03474) 


Pr u 

eba T 

d e 

d i f e r 

enci a = 

0 ( 

vs no 

= ): v 

a 1 o r T 

= 0.30 

DF 

= 98 









Amb 

os ut i 

1 i 

z a r o n 

la desvi 

a c i 

ón est 

ánda r 

c o mú n 

= 1.974 


De acuerdo con los resultados de M INITAB, la diferencia entre las medias poblacionales está entre -0.66 y 0.90. 
Así que existe la posibilidad de que no haya diferencia entre estas medias poblaci onales. 

Verificación: 

La fórmula para un intervalo de confianza de 95% es (x¡ - x 2 ) ±z c (J(s\/n x ) + (, sf/rc 2 ) )■ Sustituyendo se obtie¬ 
ne 0.12 ± 1.96(0.395) que corresponde a la respuesta dada por M INITA B. 


9.15 UsarSTATISTIX y SPSS para resolver el problema 9.14. 

SOLUCIÓN 

A continuación se presenta la solución dada por STATISTIX. Obsérvese que el intervalo de confianza de 95% es el mismo 
que el del problema 9.14. M ás adelante se verá por qué se supone que las varianzas son iguales. 
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Pruebas de dos muestras T para varones vs mujeres 

Var i abl e Medí a N SD SE 

varones 9.8200 50 2.1542 0.3046 

mujeres 9.7 0 0 0 5 0 1.7 7 5 7 0.2 5 1 1 

Diferencia 0.1200 


Hipótesis nula: diferencia =0 
Hipótesis alterna: diferencia < > 0 


Supuesto 

T 

DF 

P 

C1 9 5 % p a r a 

1 nf eri or 

di f er enci a 
Super1or 

Var i anzas i gual es 

0. 30 

98 

0. 7618 

- 0. 66 3 5 

0. 9035 

Varianzas desiguales 

0. 30 

94. 6 

0.7618 

-0. 6638 

0.9038 

Prueba para igualdad 
de varianzas 


F 

1. 47 

DF 

49, 49 

P 

0.0899 



La solución dada por SPSS es la siguiente: 


G rupo estadístico 


Sexo 

N 

M edia 

Desviación 

estándar 

M edia de error 
estándar 

momento 1.00 

50 

9.7000 

1.77569 

.25112 

2.00 

50 

9.8200 

2.15416 

.30464 


Prueba de muestras independientes 



Prueba de 
Levene 
para igualdad 
de varianzas 

Prueba t para igualdad de medias 






Sig. 

(2-fi nales) 

Diferencia 

Diferencia 

Intervalo de 
confianza de 95% 
de la diferencia 


F 

Sig. 

t 

gi 

media 

error estándar 

Inferior 

Superior 

momento Varianzas 
iguales 
supuestas 

.898 

.346 

-.304 

98 

.762 

-.12000 

.39480 

-.90347 

.66347 

Varianzas 
iguales 
no supuestas 



-.304 

94.556 

.762 

-.12000 

.39480 

-.90383 

.66383 


9.16 Usar SAS para resolver el problema 9.14. Dar las formas de archivos de datos que permiten usar SAS para 
realizar este análisis. 

SOLUCIÓN 

El análisis de SAS es como se muestra a continuación. El intervalo de confianza se ha impreso en negritas en la parte infe¬ 
rior de los resultados. 
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Dos muest r as: 

prueba t 

para las me d i a s 

de varones y 

muj eres 

Estad!sti eos 

de muest r a 





Grupo N 

Media 

Des vEs t Er r or Es t 



varones 50 

9.82 

2.1542 

0.3046 



muj er es 5 0 

9. 7 

1.7757 

0.2511 



Hipótesis nula: media 1 

- me di a 2 =0 




Al t er nat i va 

Media 1 

- me d i a 2 " = 0 




Si las varianzas son 

estadístico t 

Df 

Pr 

> t 

Igual 


0. 304 

98 

0 . 

7618 

De s i g u a 1 


0. 304 

94. 56 

0 . 

7618 

Intervalo de 

conf1 anza 

9 5 % p a r a la diferencia 

entre 

dos me di as 


L í mi t e Inferior 

L í mi t e superior 

- 0. 66 

0. 90 


L os archivos de datos que se emplean con SA S para el análisis pueden tener los datos de varones y de mujeres en columnas 
separadas, pero los datos también pueden consistir en las horas que se emplea el celular, en una columna, y el sexo de la 
persona (varón o mujer), en otra columna. Varones y mujeres se pueden codificar como 1 y 2, respectivamente. En la pri¬ 
mera forma habrá 2 columnas y 50 renglones. En la segunda forma habrá 2 columnas y 100 renglones. 


INTERVALOS DE CONFIANZA PARA DESVIACIONES ESTÁNDAR 


9.17 Para un Intervalo de confianza para la varlanza de una población se utiliza la distribución JI cuadrada. El 
Intervalo de confianza (1 - a) x 100% es donde n es el tamaño de la muestra, S 2 es la 

varlanza muestral, xl/i y Xi - a /2 pertenecen a la distribución JI cuadrada con (n - 1) grados de libertad. Use 
EXCEL para hallar un Intervalo de confianza de 99% para la varlanza de veinte recipientes de 180 onzas. Los 
datos de los veinte recipientes se presentan en la tabla 9.5. 


Tabla 9.5 


181.5 

180.8 

179.7 

182.4 

178.7 

178.5 

183.9 

182.2 

179.7 

180.9 

180.6 

181.4 

180.4 

181.4 

178.5 

180.6 

178.8 

180.1 

181.3 

182.2 


SOLUCIÓN 

A continuación se presenta la hoja de cálculo de EX C EL. Los datos se encuentran en A1:B10. En la columna D se muestran 
las funciones cuyos valores aparecen en la columna C. 
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A 

B 

C 

D 

181.5 

180.8 

2.154211 

=VAR(A 1:B 10) 

179.1 

182.4 

40.93 

=19*C1 

178.7 

178.5 

38.58226 

=C H11N V (0.005,19) 

183.9 

182.2 

6.843971 

=C H11N V (0.995,19) 

179.7 

180.9 



180.6 

181.4 

1.06085 

=C2/C3 

180.4 

181.4 

5.980446 

=C2/C4 

178.5 

180.6 



178.8 

180.1 



181.3 

182.2 




El intervalo de confianza de 99% para a 2 es: (1.06085 <a 2 < 5.980446). El intervalo de confianza de 99% para a 
es: (1.03,2.45). 

Obsérvese que con =VAR(A 1:B 10) se obtienes 2 , con =CH11N V (0.005,19) se obtiene el valor dej i cuadrada que 
tiene a su derecha un área de 0.005, y con =C H11N V (0.995,19) el valor de ji cuadrada que tiene a su derecha un área de 
0.995. En ambos casos, la distribución ji cuadrada tiene 19 grados de libertad. 

9.18 Para comparar Ia varianza de una población con la varianza de otra población se emplea el siguiente intervalo 
de confianza (1 - a) x 100%: 


d _'_ < °± < S ± F 

Si F a/2{VhVl) < al < sf al2 ^' 

donde n 1 y n 2 son los tamaños de las dos muestras, sf y sj son las dos varianzas muéstrales, v 1 = n 1 - ly 
v 2 — n 2 — 1 son los grados de libertad, en el numerador y en el denominador, para la distribución F y los valo¬ 
res F pertenecen a la distribución F. En la tabla 9.6 se dan los números de correos electrónicos enviados por 
semana por los empleados de dos empresas. 

Dar un Intervalo de confianza de 95% para —. 

a 2 


Tabla 9.6 


Empresa 1 

Empresa 2 

81 

99 

104 

100 

115 

104 

111 

98 

85 

103 

121 

113 

95 

95 

112 

107 

100 

98 

117 

95 

113 

101 

109 

109 

101 

99 


93 


105 
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SOLUCIÓN 

A continuación se muestra la hoja de cálculo de EXCEL.Enla columna D se muestran las funciones cuyos valores apare¬ 
cen en la columna C. EnClyC2se calculan las dos varianzas muéstrales. EnC3yC4se calculan los valores F. En C5 y 
C6 se calculan los extremos del intervalo de confianza para el cociente de las varianzas. Como se ve, el intervalo de con¬ 
fianza del 95% para Ú es (1.568, 15.334). El intervalo de confianza del 95% para — es (1.252, 3.916). Obsérvese que 

ai a 2 

=F IN V (0.025,12,14) es el punto que corresponde a la distribución F, con = 12 y l> 2 -= 14 grados de libertad, que tiene 
un área de 0.025 a su derecha. 


A 

B 

C 

D 

Compañía 1 

Compañía 2 

148.5769231 

=VA R(A2:A 14) 

81 

99 

31.06666667 

=VA R(B2:B 16) 

104 

100 

3.050154789 

=FINV (0.025,12,14) 

115 

104 

3.2062117 

=FINV (0.025,14,12) 

111 

98 

1.567959436 

=(C1/C2)/C3 

85 

103 

15.33376832 

=(C 1/C 2)*C 4 

121 

113 



95 

95 

1.25218187 

=SQRT(C5) 

112 

107 

3.915835584 

=SQRT(C6) 

100 

98 



117 

95 



113 

101 



109 

109 



101 

99 




93 




105 




ERROR PROBABLE 

9.19 La media del voltaje de 50 baterías del mismo tipo es 18.2 volts (V) y la desviación estándar es 0.5 V. E ncontrar: 
a) el error probable de la media y b) los límites de confianza de 50%. 

SOLUCIÓN 

a) Error probable de la media = 0.674o-^ = 0.6745-°= = 0.6745^= 

VN VN 

= 0.6745 , = . = 0.6745 = 0.048 V 

v/49 

Obsérvese que si la desviación estándar de 0.5 V se calcula como s, el error probable también es 0.6745 
(0.5/750) = 0.048, de manera que si N es suficientemente grande puede usarse cualquier estimación. 

b ) Los límites de confianza de 50% son 18 ± 0.048 V. 

9.20 Una medición se registra como 216.480 gramos (g) con un error probable de 0.272 g. ¿Cuáles son los límites 
de confianza de 95% para esta medición? 
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SOLUCIÓN 

El error probable es 0.272 = 0.67450* o bien o* = 0.272/0.6745. Por lo tanto, los límites de confianza de 95% son 
X± 1.96o* = 216.480 ± 1.96(0.272/0.6745) = 216.480 ± 0.790 g. 


PROBLEMAS SUPLEMENTARIOS 


ESTIMADORES INSESGADOSY EFICIENTES 

9.21 Las mediciones de una muestra de masas fueron 8.3,10.6,9.7,8.8,10.2 y 9.4 kilogramos (kg), respectivamente. Determinar 
estimaciones insesgadas y eficientes de: a) la media poblacional, b ) la varianza poblacional y c) comparar la desviación 
estándar muestral con la desviación estándar poblacional estimada. 


9.22 En una muestra de 10 cinescopios de televisión, producidos por una empresa, la media del tiempo de vida es 1 200 horas 
(h) y la desviación estándar es 100 h. Estimar: a) la media y b ) la desviación estándar de todos los cinescopios producidos 
por esta empresa. 

9.23 a) Repetir el problema 9.22 considerando que la muestra es de 30, 50 y 100 cinescopios de televisión. 

b ) ¿Qué se puede concluir sobre la relación entre la desviación estándar muestral y las estimaciones de la desviación 
estándar poblacional obtenidas con diferentes tamaños de muestra? 

INTERVALOS DE CONFIANZA PARA MEDIAS 

9.24 La media y la desviación estándar de la carga máxima que soporta cada uno de 60 cables (ver problema 3.59) son 11.09 
toneladas y 0.73 toneladas, respectivamente. Encontrar los límites de confianza: a) de 95% y b ) de 99% para la media de 
la carga máxima de cada uno de los cables producidos por la empresa. 


9.25 La media y la desviación estándar de los diámetros de una muestra de 250 cabezas de remaches fabricados por una empre¬ 
sa son 0.72643 ¡n y 0.00058 ¡n, respectivamente (ver problema 3.61). Encontrar los límites de confianza de: a) 99%, b) 
98%, c) 95% y d) 90% para los diámetros de todas las cabezas de remaches producidos por la empresa. 


9.26 Encontrar: a) los límites de confianza de 50% y b) el error probable para la media de los diámetros del problema 9.25. 


9.27 Si se estima que la desviación estándar del tiempo de vida de los cinescopios de televisión es de 100 h, ¿de qué tamaño 
deberá tomarse la muestra para que se tenga una confianza de: a) 95%, b ) 90%, c) 99% y d) 99.73% de que el error en la 
vida media estimada no sea mayor de 20 h? 


9.28 A los integrantes de un grupo de 50 personas que acostumbra comprar por Internet se les preguntó cuánto gastaban anual¬ 
mente en estas compras por Internet. Las respuestas obtenidas se presentan en la tabla 9.7. 

Empleando las ecuaciones del capítulo 9, así como paquetes de software para estadística, encontrar un intervalo de 
80% para la cantidad media gastada por las personas que compran por Internet. 
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Tabla 9.7 


418 

379 

77 

212 

378 

363 

434 

348 

245 

341 

331 

356 

423 

330 

247 

351 

151 

220 

383 

257 

307 

297 

448 

391 

210 

158 

310 

331 

348 

124 

523 

356 

210 

364 

406 

331 

364 

352 

299 

221 

466 

150 

282 

221 

432 

366 

195 

96 

219 

202 


9.29 U na empresa tiene 500 cables. En una prueba realizada a 40 cables tomados en forma aleatoria se encuentra que la resis¬ 
tencia media a la ruptura es 2 400 libras (Ib) y la desviación estándar es 150 Ib. 

a) ¿Cuáles son los límites de confianza de 95% y 99% para la estimación de la resistencia media a la ruptura de los 460 
cables restantes? 

b ) ¿Con qué grado de confianza se puede decir que la resistencia media a la ruptura de los 460 cables restantes es 2 400 
±35 Ib? 

INTERVALOS DE CONFIANZA PARA PROPORCIONES 

9.30 U na urna contiene canicas rojas y blancas en proporción desconocida. En una muestra aleatoria de 60 canicas tomadas de 
esta urna, con reposición, se observó que 70% eran rojas. Encontrar límites de confianza de: a) 95%, b ) 99% y c) 99.73% 
para la verdadera proporción de canicas rojas en esta urna. 

9.31 Se realizó un sondeo con 1 000 personas mayores de 65 años para determinar el porcentaje de la población de este grupo 
de edad que tiene conexión a Internet. Se encontró que 387 de las 1 000 personas contaban con conexión a Internet. 
Empleando las ecuaciones dadas en este libro, así como software para estadística, encontrar un intervalo de confianza de 
97.5% parap. 

9.32 Se cree que los resultados de la elección entredós candidatos sean muy reñidos. ¿Cuál será la cantidad mínima de votantes 
que habrá que sondear para tener una confianza de: a) 80%, b) 90%, c) 95% y d) 99% para una decisión a favor de cual¬ 
quiera de los candidatos? 


INTERVALOS DE CONFIANZA PARA DIFERENCIAS Y SUMAS 

9.33 Se tienen dos grupos similares de pacientes, A y 6, que constan de 50 y 100 individuos, respectivamente. A las personas 
del primer grupo se les administra una nueva pastilla para dormir, y a las del segundo, una pastilla convencional. En los 
pacientes del grupo A la media de la cantidad de horas de sueño es 7.82 y la desviación estándar 0.24 h; en los pacientes 
del grupo 6 la media de la cantidad de horas de sueño es 6.75 y la desviación estándar es 0.30 h. Encontrar los límites de 
confianza: a) de 95% y b ) de 99% para la diferencia entre las medias de la cantidad de horas de sueño inducido por los dos 
tipos de pastillas para dormir. 

9.34 Se realiza un estudio para comparar la duración media de vida de los varones con la de las mujeres. Se toman muestras 
aleatorias de las páginas del obituario: los datos recolectados se presentan en la tabla 9.8. 

Usando los resultados proporcionados en dicha tabla, las ecuaciones presentadas en este libro y un software para 
estadística, dar un intervalo de confianza de 85% para ¿¿varones - ¿¿mujeres- 
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Tabla 9.8 


Varones 

M ujeres 

85 

53 

O 

O 

i—1 

49 

65 

64 

93 

82 

71 

77 

60 

51 

61 

83 

65 

64 

60 

75 

87 

60 

55 

99 

56 

55 

55 

61 

84 

91 

61 

85 

90 

72 

62 

69 

59 

105 

90 

59 

86 

62 

49 

72 

58 

60 

68 

71 

99 

98 

54 

94 

90 

74 

85 

80 

77 

98 

61 

CO 

O 

I—1 

79 

50 

62 

65 

81 

55 

71 

66 

74 

60 

90 

95 

78 

49 

78 

80 

75 

81 

86 

65 

86 

81 

53 

82 

109 

87 

78 

92 

77 

82 

86 

79 

72 

104 

70 

31 

50 

91 

93 

63 

93 

53 


9.35 Se comparan dos áreas de un país respecto a la proporción de adolescentes con caries. E n una de estas áreas se agrega flúor 
al agua y en la otra no. En la muestra del área en donde no se agrega flúor al agua, 425 de 1 000 adolescentes tienen por lo 
menos una caries. En la muestra del área en donde sí se agrega flúor al agua, 376 de 1 000 adolescentes tienen por lo menos 
una caries. Dar un intervalo de confianza de 99% para esta diferencia, en porcentaje, empleando las ecuaciones dadas en 
este libro, así como un paquete de software para estadística. 


INTERVALOS DE CONFIANZA PARA DESVIACIONES ESTÁNDAR 

9.36 La desviación estándar en la resistencia a la ruptura encontrada en 100 cables de una empresa es 180 Ib. Dar límites de 
confianza de: a) 95%, b) 99% y c) 99.73% para la desviación estándar de todos los cables producidos por esta empresa. 

9.37 Resolver el problema 9.17 empleando SAS. 

9.38 Resolver el problema 9.18 empleando SAS. 













T EORÍA 
ESTADÍSTICA 
DE LA DECISIÓN 



DECISIONES ESTADÍSTICAS 

En la práctica, con frecuencia se tienen que tomar decisiones acerca de una población con base en información mues- 
tral. A tales decisiones seles llama decisiones estadísticas. Por ejemplo, tal vez se tenga que decidir, con base en datos 
muéstrales, si determinado suero es realmente eficaz en la curación de una enfermedad, si un método educativo es 
mejor que otro, o bien si una moneda está alterada o no. 


HIPÓTESIS ESTADÍSTICAS 

Cuando se trata de tomar una decisión es útil hacer suposiciones (o conjeturas) acerca de la población de que se trata. 
A estas suposiciones, que pueden ser o no ciertas, se les llama hipótesis estadísticas. Estas hipótesis estadísticas son 
por lo general afirmaciones acerca de las distribuciones de probabilidad de las poblaciones. 


H ipótesis nula 

En muchas ocasiones se formula una hipótesis estadística con la única finalidad de refutarla o anularla. Por ejemplo, 
si se quiere decidir si una moneda está cargada o no, se formula la hipótesis de que no está cargada (es decir, p = 0.5, 
dondep es la probabilidad de cara). También, si se quiere decidir si un método es mejor que otro, se formula la hipó¬ 
tesis de que no hay diferencia entre los dos (es decir, que cualquier diferencia que se observe se debe sólo a las fluc¬ 
tuaciones del muestreo de una misma población). A estas hipótesis se les llama hipótesis nula y se denota H 0 . 


H ipótesis alternativa 

A toda hipótesis que difiera de la hipótesis dada se le llama hipótesis alternativa. Por ejemplo, si una hipótesis es p = 
0.5, la hipótesis alternativa puede ser p = 0.7, p + 0.5 o p > 0.5. La hipótesis alternativa a la hipótesis nula se denota 
H i- 
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PRUEBASDE HIPÓTESISY DE SIGNIFICANCIA O REGLASDE DECISIÓN 

Si se supone que una hipótesis es verdadera, pero se encuentra que los resultados que se observan en una muestra 
aleatoria difieren marcadamente délos resultados esperados de acuerdo con la hipótesis (es decir, esperados con base 
sólo en la casualidad, empleando la teoría del muestreo), entonces se dice que las diferencias observadas son signifi¬ 
cativas y se estará Inclinado a rechazar la hipótesis (o por lo menos a no aceptarla de acuerdo con la evidencia obteni¬ 
da). Por ejemplo, si en 20 lanzamientos de una moneda se obtienen 16 caras, se estará inclinado a rechazar que la 
moneda es buena, aun cuando se puede estar equivocado. 

A los procedimientos que permiten determinar si las muestras observadas difieren significativamente de los resul¬ 
tados esperados, ayudando así a decidir si se acepta o se rechaza la hipótesis, se les IIama pruebas de hipótesis, pruebas 
de significancia o reglas de decisión. 


ERRORESTIPO I YTIPO II 

Si se rechaza una hipótesis que debería aceptarse se dice que se comete un error tipo I. SI por otro lado, se acepta una 
hipótesis que debería rechazarse, se comete un error tipo II. En cualquiera de los casos ha habido una decisión errónea 
o se ha hecho un juicio erróneo. 

Para que las reglas de decisión (o pruebas de hipótesis) sean buenas, deben diseñarse de manera que se minimicen 
los errores de decisión. Esto no es sencillo, ya que para cualquier tamaño dado de muestra, al tratar de disminuir un 
tipo de error suele Incrementarse el otro tipo de error. En la práctica, un tipo de error puede ser más importante que 
otro y habrá que sacrificar uno con objeto de limitar al más notable. La única manera de reducir los dos tipos de error 
es aumentando el tamaño de la muestra, lo que no siempre es posible. 

NIVEL DE SIGNIFICANCIA 

Cuando se prueba determinada hipótesis, a la probabilidad máxima con la que se está dispuesto a cometer un error tipo 
I se le llama nivel de significancia de la prueba. Esta probabilidad acostumbra denotarse a y por lo general se especi¬ 
fica antes de tomar cualquier muestra para evitar que los resultados obtenidos Influyan sobre la elección del valor de 
esta probabilidad. 

En la práctica, se acostumbran los niveles de significancia 0.05 o 0.01, aunque también se usan otros valores. SI, 
por ejemplo, al diseñar la regla de decisión se elige el nivel de significancia 0.05 (o bien 5%), entonces existen 5 posi¬ 
bilidades en 100 de que se rechace una hipótesis que debía ser aceptada; es decir, se tiene una confianza de aproxima¬ 
damente 95% de que se ha tomado la decisión correcta. En tal caso se dice que la hipótesis ha sido rechazada al nivel 
de significancia 0.05, lo que significa que la hipótesis tiene una probabilidad de 0.05 de ser errónea. 


PRUEBAS EMPLEANDO DISTRIBUCIONES NORMALES 

Para ¡lustrar las ¡deas presentadas antes, supóngase que de acuerdo con determinada hipótesis, la distribución muestral 
de un estadístico S es una distribución normal con media /¿ s y desviación estándar a s . Por lo tanto, la distribución de 
la variable estandarizada (o puntuación z), dada por z = (S - /i S )/cr s , es la distribución normal estándar (media 0, 
varlanza 1), que se muestra en la figura 10-1. 

Como Indica la figura 10-1, se puede tener una confianza del 95% en que si la hipótesis es verdadera, entonces la 
puntuación z del estadístico muestral real S estará entre -1.96 y 1.96 (ya que el área bajo la curva normal entre estos 
dos valores es 0.95). Pero si se toma una sola muestra aleatoria y se encuentra que la puntuación z del estadístico se 
encuentra fuera del rango -1.96 a 1.96, se concluye que si la hipótesis dada es verdadera, esto sólo puede ocurrir con 
una probabilidad de 0.05 (el total del área sombreada en la figura). En tal caso se dice que la puntuación z difiere en 
forma significativa de lo esperado de acuerdo con la hipótesis dada y se estará Inclinado a rechazar esa hipótesis. 

El 0.05, que es el total de área sombreada, es el nivel de significancia de la prueba. Esta cantidad representa la 
probabilidad de estar equivocado al rechazar la hipótesis (es decir, la probabilidad de cometer un error tipo I). Por lo 
tanto, se dice que la hipótesis se rechaza al nivel de significancia 0.05 o que la puntuación z del estadístico muestral 
dado es significante al nivel 0.05. 
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Figura 10-1 Curva normal estándar mostrando la región crítica (0.05) y 
la región de aceptación (0.95). 


El conjunto de puntuaciones z que queda fuera del Intervalo -1.96 a 1.96 constituyelo que se llama región crítica 
de la hipótesis, región de rechazo de la hipótesis o región de significancia. AI conjunto de puntuaciones z que queda 
dentro del Intervalo -1.96 a 1.96 se le llama región de aceptación de la hipótesis o región de no significancia. 

De acuerdo con las observaciones anteriores, se puede formular la siguiente regla de decisión (o prueba dehlpóte- 
sis o de significancia): 

Rechazar la hipótesis, al nivel de significancia 0.05, si la puntuación z del estadístico S se encuentra fuera del rango 

-1.96 a 1.96 (es decir, si z > 1.96 o z < -1.96). Esto equivale a decir que el estadístico muestral observado es 

significante al nivel 0.05. 

SI no es así, se acepta la hipótesis (o, si se desea, no se toma ninguna decisión). 

Debido a que la puntuación z es tan Importante en las pruebas de hipótesis, también se le conoce como el estadís¬ 
tico de prueba. 

H ay que hacer notar que también pueden emplearse otros niveles de significancia. Por ejemplo, si se emplea el 
nivel 0.01, el 1.96, empleado antes se sustituirá por 2.58 (ver la tabla 10.1). También se puede emplear la tabla 9.1, ya 
que los niveles de significancia y de confianza suman 100%. 


Tabla 10.1 


Nivel de significancia, a 

0.10 

0.05 

0.01 

0.005 

0.002 

Valores críticos dez para 
pruebas de una cola 

-1.28 
o 1.28 

-1.645 
o 1.645 

-2.33 

0 2.33 

-2.58 

0 2.58 

-2.88 

0 2.88 

Valores críticos dez para 
pruebas de dos colas 

-1.645 
y 1.645 

-1.96 
y 1.96 

-2.58 
y 2.58 

-2.81 
y 2.81 

-3.08 
y 3.08 


PRUEBAS DE UNAY DE DOS COLAS 

En la prueba anterior Interesaban los valores extremos del estadístico 5, o de sus correspondientes puntuaciones z, a 
ambos lados de la media (es decir, en las dos colas de la distribución). Por lo tanto, a las pruebas de este tipo se les 
llama pruebas bilaterales o pruebas de dos colas. 

Sin embargo, hay ocasiones en las que Interesan únicamente los valores extremos a un solo lado de la media (es 
decir, en una sola cola de la distribución); por ejemplo, cuando se prueba si un método es mejor que otro (que es dis¬ 
tinto a probar si un método es mejoro peor que otro). A este tipo de pruebas se les II ama pruebas unilaterales o prue¬ 
bas de una cola. En estos casos la región crítica es una región en un solo lado de la distribución y su área es Igual al 
nivel de significancia. 
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La tabla 10.1, en la que se dan los valores críticos dez tanto para pruebas de una cola como para pruebas de dos 
colas correspondientes a varios niveles de significancia, se encontrará útil como referencia. Valores críticos dez para 
otros niveles de significancia se encuentran en la tabla de áreas de la curva normal (apéndice II). 

PRUEBAS ESPECIALES 

Cuando las muestras son grandes, las distribuciones muéstrales de muchos estadísticos tienen una distribución normal 
(o por lo menos aproximadamente normal), y en estas pruebas se puede emplear la correspondiente puntuación z. Los 
siguientes casos especiales, tomados de la tabla 8.1, son sólo algunos de los estadísticos de Interés práctico. En cada 
uno de estos casos, el resultado es válido para poblaciones infinitas o cuando el muestreo se hace con reposición. SI el 
muestreo se hace de poblaciones finitas y sin reposición, es necesario modificar las fórmulas. Ver la página 182. 

1. Media. Aquí 5 = X, la media muestral; p s = p x = p,\a media poblacional, y<7 S = <j x = cr/y/Ñ, donde o- es la 
desviación estándar poblacional y N es el tamaño de la muestra. La puntuación z está dada por 


a/y/Ñ 

SI es necesario, para estimar a se emplea la desviación muestral sos. 

2. Proporciones. Aquí S = P, la proporción de "éxitos" en una muest ra; p s = p P = p, donde p es la proporción 
poblacional de éxitos y N es el tamaño de la muestra, y a s = o> = y/pq/N, donde q = 1 - p. 

La puntuación z está dada por 


z = 


p-p 

yfpqJÑ 


En el caso deP = X/N, dondeX = cantidad de éxitos obtenidos realmente en una muestra, la puntuación z se 
transforma en 


X-Np 

y/Ñpq 


Es decir, p x = p = Np, a x = <j = y/Npq y S = X. 

Las fórmulas para otros estadísticos se pueden obtener de manera similar. 

CURVA CARACTERÍSTICA DE OPERACIÓN; POTENCIA DE UNA PRUEBA 

Se ha visto cómo limitar el error tipo I eligiendo de manera adecuada el nivel de significancia. Para evitar totalmente 
cometer un error tipo II, simplemente no hay que cometerlo, que es lo mismo que no aceptar ninguna hipótesis. Sin 
embargo, en la práctica esto no es posible. Entonces lo que se hace es emplear las curvas características de operación 
o curvas OC, que son curvas que muestran la probabilidad de cometer un error tipo II bajo diversas hipótesis. Estas 
curvas proporcionan Indicaciones de qué tan bien permite una prueba determinada minimizar los errores tipo II; es 
decir, Indican la potencia de una prueba para evitar que se cometan errores de decisión. Estas curvas son útiles en el 
diseño de experimentos, ya que muestran Informaciones como qué tamaño de muestra emplear. 

VALORpEN PRUEBASDE HIPÓTESIS 

El valor p es la probabilidad de obtener un estadístico muestral tan extremo o más extremo que el obtenido, suponien¬ 
do que la hipótesis nula sea verdadera. Para probar una hipótesis empleando este método se establece un valor a; se 
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calcula el valor p y si el valor p < a, se rechaza H 0 . En caso contrario, no se rechaza H 0 . En pruebas para medias 
empleando muestras grandes (n > 30), el valor p se calcula como sigue: 

1. Para H 0 : p = p 0 y H 1 : p < p 0 , valor p = P(Z < el estadístico de prueba calculado). 

2. Para /-/ 0 : p = p 0 y H 2 : p > p 0 , valor p = P(Z > el estadístico de prueba calculado). 

3. Para H 0 : p = p 0 y H 1 : p * p 0 , valor p = P(Z <-| el estadístico de prueba calculado |) + P[Z > | el estadístico 
de prueba calculado |). 

El estadístico de prueba calculado es A - ^.° , donde x es la media de la muestra, s es la desviación estándar de la 

O /y/n) 

muestra y p 0 es el valor que se ha especificado para p en la hipótesis nula. Obsérvese que a no se conoce, se estima 
a partir de la muestra y se usa s. Este método para pruebas de hipótesis es equivalente al método de hallar el o los 
valores críticos y si el estadístico de prueba cae en la región de rechazo, rechazar la hipótesis nula. Usando cualquiera 
de estos métodos se llega a la misma decisión. 

GRÁFICASDE CONTROL 

En la práctica suele ser importante darse cuenta cuándo un proceso ha cambiado lo suficiente como para que se deban 
tomar medidas para remediar la situación. Estos problemas surgen, por ejemplo, en el control de calidad. Los supervi¬ 
sores de control de calidad deben decidir si los cambios observados se deben sólo a fluctuaciones casuales o a verda¬ 
deros cambios en el proceso de fabricación debidos al deterioro de las máquinas, a los empleados, a errores, etc. Las 
gráficas de control proporcionan un método útil y sencillo para tratar tales problemas (ver problema 10.16). 

PRUEBAS PARA DIFERENCIAS MUESTRALES 
Diferencias entre medias 

Sean X, y X 2 las medias muéstrales de muestras grandes de tamaños A/ x y N 2 obtenidas de poblaciones cuyas medias 
son y p 2 y cuyas desviaciones estándar son o Y y <r 2 , respectivamente. Considérese la hipótesis nula de que no hay 
diferencia entre las dos medias poblacionales (es decir, p 2 = p 2 ), lo cual es equivalente a decir que las muestras se han 
tomado de dos poblaciones que tienen la misma media. 

Haciendo p 2 = p 2 en la ecuación (5) del capítulo 8 se ve que la distribución muestral de las diferencias éntrelas 
medias es aproximadamente normal con media y desviación estándar dadas por 


OÍ Oj ... 

PXI-X 2 = 0 y &XI-X2 = Y Jj- + u) 

donde, si es necesario, se pueden usar las desviaciones estándar muéstrales s 2 y s 2 (o i] y s 2 ) como estimaciones de a 2 
Y o> 

Empleando la variable estandarizada, o puntuación z, dada por 

X\-X 2 -0 Xi-X 2 

z — -=- ( 2 ) 

a Xl-X2 °X\-X2 

se puede probar la hipótesis nula contra la hipótesis alternativa (o la significancia de la diferencia observada) a un nivel 
de significancia apropiado. 

Diferencias entre proporciones 

Sean P 2 y P 2 las proporciones muéstrales de muestras grandes de tamaños N 2 y W 2 obtenidas de poblaciones cuyas 
proporciones son p 2 y p 2 . Considérese la hipótesis nula de que no hay diferencia entre estos parámetros poblacionales 
(es decir, p 1 = p 2 ) y que por lo tanto las muestras se han obtenido real mente de la misma población. 
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Haciendo, en la ecuación (6) del capítulo 8, p 1 = p 2 = p, sevequela distribución muestral de las diferencias entre 
las proporciones es aproximadamente normal, y que su media y su desviación estándar están dadas por 


Mpi - ^P2 — o y 



(3) 


donde 


Aq p i n 2 p 2 

+ N 2 


se usa como estimación de la proporción poblacional y donde q = 1 - p. 
Empleando la variable estandarizada 


. = Pi-Pi -0 = P1-P2 

a Pl-P2 a P\-P2 

se puede probar la diferencia observada a nivel de significancia apropiado y con esto probar la hipótesis nula. 
Se pueden hacer pruebas con otros estadísticos de manera similar. 


(4) 


PRUEBAS EMPLEANDO DISTRIBUCIONES BINOMIALES 

Las pruebas en las que se usen distribuciones blnomiales (así como otras distribuciones) pueden hacerse de manera 
análoga a las pruebas en las que se emplean distribuciones normales; el principio básico es esencialmente el mismo. 
Ver los problemas del 10.23 al 10.28. 


PROBLEMAS RESUELTOS 


PRUEBAS DE ME DIAS Y PROPORCIONES EMPLEANDO DISTRIBUCIONES NORMALES 

10.1 Encontrar la probabilidad de obtener entre 40 y 60 caras Inclusive en 100 lanzamientos de una moneda que no 
esté cargada. 

SOLUCIÓN 

De acuerdo con la probabilidad binomíal, la probabilidad buscada es 



Como tanto Np = 1000 como Nq = 1000 son mayores que 5, para evaluar esta suma puede emplearse la aproximación 
normal a la distribución binomial. La media y la desviación estándar de la cantidad de caras en 100 lanzamientos están 
dadas por 


¡i = Np = 1000 = 50 y a = VÑpq = ^(100)00 = 5 


En una escala continua, entre 40 y 60 caras corresponden a entre 39.5 y 60.5 caras. Por lo tanto, se tiene 

39.5 en unidades estándar = 39,5 s 50 = -2.10 60.5 en unidades estándar = 6Q ’ 5 s 50 = 2.10 

Probabilidad buscada = área bajo la curva normal entrez = -2.10 y z = 2.10 
= 2(área entrez = 0 y z = 2.10) = 2(0.4821) = 0.9642. 
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10.2 Para probar la hipótesis de que una moneda no está cargada se adopta la siguiente regla de decisión: 

Aceptar la hipótesis si el número de caras de una sola muestra de 100 lanzamientos está entre 40 y 60 
Inclusive. 

Rechazar la hipótesis si no es así. 

a) Encontrar la probabilidad de rechazar la hipótesis en caso de que en realidad sea correcta. 

b) Graficar la regla de decisión y el resultado del inciso a). 

c) ¿A qué conclusión se llega si en la muestra de 100 lanzamientos se obtienen 53 caras? ¿Y si se obtienen 
60 caras? 

d) ¿Puede estar equivocada la conclusión obtenida en el Inciso c)? 

SOLUCIÓN 

a) De acuerdo con el problema 10.1, la probabilidad deque no se obtengan entre 40 y 60 caras inclusive si la moneda no 
está cargada es 1 - 0.9642 = 0.0358. Por lo tanto, la probabilidad de rechazar la hipótesis (nula) cuando en realidad 
sea correcta es 0.0358. 

b) En la figura 10.2 se ilustra la regla de decisión. Se muestra la distribución de probabilidad para la obtención de caras 
en 100 lanzamientos de una moneda no cargada. Si en una sola muestra de 100 lanzamientos se obtiene una puntuación 
z entre -2.10 y 2.10, se acepta la hipótesis; si no es así, se rechaza la hipótesis y se concluye que la moneda está 
cargada. 

El error que se comete si se rechaza la hipótesis cuando en realidad deba aceptarse es el error tipo i de la regla 
de decisión, y la probabilidad de cometer este error es igual a 0.0358, de acuerdo con el inciso a); este error está 
representado por el total del área sombreada de la figura. Si en una sola muestra de 100 lanzamientos se obtiene una 
cantidad de caras cuya puntuación z (o estadístico z) se encuentra en la reglón sombreada, se dice que la puntuación z 
difiere de manera significativa de lo que se esperaría si la hipótesis fuera verdadera. Es por esta razón que a la reglón 
sombreada (es decir, a la probabilidad de cometer un error tipo I) se le conoce como nivel de significancia de la regla 
de decisión, que en este caso es igual a 0.0358. Por lo tanto, se habla de rechazo de la hipótesis a nivel de significancia 
0.0358 (0 3.58%). 

c) De acuerdo con la regla de decisión, en ambos casos debe aceptarse la hipótesis de que la moneda no está cargada. 
Puede argumentarse que bastará que se obtenga una cara más para que se rechace la hipótesis. Esto es a lo que se 
enfrenta cuando se emplea una clara línea divisoria para tomar una decisión. 

d) Sí. Tal vez se acepte la hipótesis cuando en realidad debería haberse rechazado, que sería el caso, por ejemplo, si la 
probabilidad de cara fuera en realidad 0.7 en lugar de 0.5, El error que se comete al aceptar una hipótesis que debería 
rechazarse es un error tipo II de la decisión. 



Figura 10-2 Curva normal estándar en la que se muestran las regiones de aceptación 
y de rechazo para probar que una moneda no está cargada. 
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10.3 Empleando la distribución blnomlal y no la aproximación normal a la distribución binomial, diseñar una regla 
de decisión para probar la hipótesis de que una moneda no está cargada si se emplea una muestra de 64 lanza¬ 
mientos y se usa como nivel de significancia 0.05. Usar M INITAB como ayuda para encontrar la solución. 

SOLUCIÓN 

En la figura 10-3 se presenta la gráfica de probabilidades binomiales cuando una moneda no cargada se lanza 64 veces. 
Abajo de la figura 10-3 se presentan las probabilidades acumuladas generadas con M INITAB. 



x 

Figura 10-3 M INITAB, gráfica déla distribución binomial correspondiente a n = 64 y p = 0.5. 


X 

Pr obabi1 i dad 

Ac umu 1 a da 

X 

Probabilidad 

A c u mu 1 a d a 

0 

0. 0000000 

0.0000000 

13 

0. 

0000007 

0. 

0000009 

1 

0. 0000000 

0.0000000 

14 

0. 

0000026 

0. 

0000035 

2 

0. 0000000 

0.0000000 

15 

0. 

0000086 

0. 

0000122 

3 

0. 0000000 

0.0000000 

16 

0. 

0000265 

0. 

0000387 

4 

0. 0000000 

0.0000000 

17 

0. 

0000748 

0. 

0001134 

5 

0. 0000000 

0.0000000 

18 

0. 

0001952 

0. 

0003087 

6 

0. 0000000 

0.0000000 

19 

0. 

0004727 

0. 

0007814 

7 

0. 0000000 

0.0000000 

20 

0. 

0010636 

0. 

0018450 

8 

0. 0000000 

0.0000000 

21 

0. 

0022285 

0. 

0040735 

9 

0. 0000000 

0.0000000 

22 

0. 

0043556 

0. 

0084291 

10 

0. 0000000 

0.0000000 

23 

0. 

0079538 

0. 

0163829 

11 

0. 0000000 

0.0000001 

24 

0. 

0135877 

0. 

0299706 

12 

0. 0000002 

0.0000002 

25 

0. 

0217403 

0. 

0517109 


Como se ve, P(X < 23) = 0.01638. Como la distribución es simétrica, se sabe también queP(X > 41) = 0.01638. La 
región de rechazo {X < 23 y X > 41} tiene la probabilidad 2(0.01638) = 0.03276. La región de rechazo {X < 24 y X > 40} 
es mayor que 0.05. Cuando se usa una distribución binomial no se puede tener una región de rechazo exactamente igual a 
0.05. Lo más cercano a 0.05 que se puede tener, sin que se tenga una probabilidad mayor a este valor, es 0.03276. 

Resumiendo, la moneda se lanza 64 veces. Se declarará que está cargada, o no equilibrada, si se obtienen 23 o menos, 
o 41 o más caras. La posibilidad de cometer un error tipo I es 0.03276, que es lo más cerca que se puede estar de 0.05, sin 
sobrepasar este valor. 

10.4 Volver al problema 10.3. Usando la distribución blnomlal, no la aproximación normal a la distribución blnomlal, 
diseñar una regla de decisión para probar la hipótesis de que la moneda no está cargada empleando una mués- 
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tra de 64 lanzamientos de la moneda y un nivel de significancia de 0.05. Emplear EXCEL como ayuda para dar 
la solución. 

SOLUCIÓN 

En lacolumnaA de la hoja decálculo de EX C E L se Ingresan los resultados 0 a 64. Lasexpres¡ones=BINOM DIST (A 1,64,0.5,0) 
y =BINOM DIST(A 1,64,0.5,1) se emplean para obtener la distribución binomial y la distribución blnomial acumulada. El 
0, que aparece como cuarto parámetro, indica que se requieren probabilidades individuales, y el 1 indica que se desean las 
probabilidades acumuladas. Haciendo clic y arrastrando en la columna B se obtienen las probabilidades individuales y 
haciendo clic y arrastrando en la columna C se obtienen las probabilidades acumuladas. 


A 

B 

C 

A 

B 

C 

X 

Pr obabi1 i dad 

Ac u mu 1 a da 

X 

Probabilidad 

Ac umu 1 a da 

0 

5. 42101E-20 

5. 42101E-20 

13 

7. 12151E-07 

9. 40481E-07 

1 

3. 46945E-18 

3. 5 2 3 6 6 E- 18 

14 

2. 5 9 4 2 6 E- 06 

3. 53474E-06 

2 

1. 09288E-16 

1. 12811E- 16 

15 

8. 64754E-06 

1. 21823E-05 

3 

2. 25861E-15 

2. 3 7 1 4 2 E- 15 

16 

2. 64831E-05 

3. 86654E-05 

4 

3. 44438E-14 

3. 6 8 1 5 2 E- 14 

17 

7. 47758E-05 

0.000113441 

5 

4. 13326E-13 

4. 50141E-13 

18 

0. 000195248 

0. 000308689 

6 

4. 06437E-12 

4. 51451E-12 

19 

0. 000472706 

0. 000781395 

7 

3. 36762E-11 

3. 81907E-11 

20 

0. 001063587 

0.001844982 

8 

2. 39943E-10 

2. 78134E-10 

21 

0. 002228469 

0.004073451 

9 

1. 49298E-09 

1. 77111E-09 

22 

0.004355644 

0. 008429095 

10 

8. 21138E-09 

9. 98249E-09 

23 

0. 007953785 

0. 01638288 

11 

4.03104E-08 

5. 02929E-08 

24 

0. 013587715 

0. 029970595 

12 

1. 78038E-07 

2. 28331E-07 

25 

0. 021740344 

0. 051710939 


Se encuentra, como en el problema 10.3, queP(X < 23) = 0.01638 y debido a la simetría, P(X > 41) = 0.01638, y que la 
región de rechazo es {X < 23 oX > 41} y el nivel de significancia es 0.01638 + 0.01638 o bien 0.03276. 



Figura 10-4 Determinación del valor Z quedará una región crítica igual a 0.05. 


10.5 Se realiza un experimento de percepción extrasensorlal (PES) en el que se pide a un Individuo que está en una 
habitación que adivine el color (rojo o verde) de una carta extraída de un juego de 50 cartas bien mezcladas por 
una persona en otra habitación. El individuo no sabe cuántas cartas rojas o verdes hay en ese conjunto de cartas. 
SI este Individuo Identifica 32 cartas correctamente, determinar si los resultados son significativos al nivel: a) 
0.05 y ó) 0.01. 
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SOLUCIÓN 

Si p es la probabilidad de que la persona elija correctamente el color de la carta, entonces hay que decidir entre las dos 
hipótesis: 

H 0 : p = 0.5, el individuo simplemente está adivinando (es decir, el resultado se debe a la casualidad). 

H 1 : p > 0.5, la persona tiene PES. 

Como lo que Interesa no es la habilidad de la persona para obtener puntuaciones extremadamente bajas, sino sólo su 
habilidad para obtener puntuaciones altas, se elige una prueba de una cola. SI la hipótesis H 0 es verdadera, entonces la media 
y la desviación estándar de la cantidad de cartas identificadas correctamente están dadas por 

p = Np = 50(0.5) = 25 y a = = \/50(a5)((T5) = \/l23 = 3.54 

a) Como se trata de una prueba de una cola con nivel de significancia 0.05, en la figura 10-4 se debe elegir z de manera 
que el área sombreada, en la región crítica de puntuaciones altas, sea 0.05. El área entre 0 y z será 0.4500 y z = 1.645; 
este valor también se puede leer en la tabla 10.1. Por lo tanto, la regla de decisión (o prueba de significancia) es: 

Si la puntuación z observada es mayor a 1.645, los resultados son significativos al nivel 0.05 y la persona tiene 
poderes extrasensoriales. 

Si la puntuación z es menor a 1.645, los resultados se deben a la casualidad (es decir, no son significativos al 
nivel 0.05). 

Como 32 en unidades estándar (32 - 25)/3.54 = 1.98, lo cual es mayor a 1.645, se concluye, al nivel 0.05, que 
la persona tiene poderes extrasensoriales. 

Obsérvese que en realidad debe aplicarse la corrección por continuidad, ya que 32 en una escala continua está 
entre 31.5 y 32.5. Sin embargo, la puntuación estándar correspondiente a 31.5 es (31.5 - 25)/3.54 = 1.84, con lo que 
se llega a la misma conclusión. 

b) Si el nivel de significancia es 0.01, entonces el área entre 0 y z es 0.4900, de donde se concluye quez = 2.33. 

Como 32 (o 31.5) en unidades estándares 1.98 (o 1.84), que es menor a 2.33, se concluye que los resultados no son 
significativos al nivel 0.01. 

Algunos especialistas en estadística adoptan la siguiente terminología: resultados significativos al nivel 0.01 son 
altamente significativos; resultados significativos al nivel 0.05, pero no al nivel 0.01, son probablemente significativos, y 
resultados significativos a niveles mayores a 0.05 no son significativos. De acuerdo con esta terminología se concluye que 
los resultados experimentales anteriores son probablemente significativos, de manera que será necesario hacer más inves¬ 
tigaciones acerca del fenómeno. 

Como los niveles de significancia sirven de guía en la toma de decisiones, algunos especialistas en estadística dan 
las probabilidades empleadas. Por ejemplo, como en este problema, Pr{z > 1.84} = 0.0322, un especialista en estadística 
dirá que con base en el experimento, las posibilidades de estar equivocado al concluir que la persona tiene poderes extra¬ 
sensoriales son aproximadamente 3 en 100. A la probabilidad que se da (0.0322 en este caso) se le conoce como valor p de 
la prueba. 

10.6 Se asegura que 40% de las personas que hacen sus declaraciones de impuestos, las hacen empleando algún 
software para impuestos. En una muestra de 50 personas, 14 emplearon software para hacer su declaración de 
impuestos. Probar H 0 : p = 0.4 versus H a : p < 0.4 a a = 0.05, donde p es la proporción poblacional de los que 
emplean software para hacer su declaración de impuestos. Haga la prueba empleando la distribución blnomial 
y también empleando la aproximación normal a la distribución blnomial. 

SOLUCIÓN 

Si se emplea la prueba exacta H 0 : p = 0.4 versus H a : p < 0.4 a a = 0.05, la hipótesis nula se rechaza si X < 15. A esta región 
se le llama la reglón de rechazo. Si se emplea la prueba basada en la aproximación normal a la binomial, la hipótesis nula 
se rechaza si Z < -1.645 y a esta reglón se le llama la región de rechazo. A X = 14 se le llama estadístico de prueba. El 
estadístico de prueba binomial está en la región de rechazo y la hipótesis nula se rechaza. Usando la aproximación normal, 
el estadístico de prueba es z = = -1.73. El verdadero valor dea es 0.054 y la región de rechazo esX < 15 y se emplea 

la probabilidad binomial acumulada P(X < 15). Empleando la aproximación normal también se rechazará la hipótesis nula, 
ya quez = -1.73 está en la región de rechazo que es Z < -1.645. Obsérvese que si se usa la distribución binomial para 
realizar la prueba, el estadístico de prueba tiene una distribución binomial. Si se emplea la distribución normal, el estadís¬ 
tico de prueba, Z, tiene una distribución normal estándar. 
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0 

Figura 10-5 


10 20 30 40 50 Z =-1.645 

Comparación entre la prueba exacta a la izquierda (binomial) y la prueba aproximada 
a la derecha (normal estándar). 



10.7 El valorpen una prueba de hipótesis se define como el menor nivel de significancia al cual se rechaza la hipó¬ 
tesis nula. En este problema se ilustra el cálculo del valor p para un estadístico de prueba. Usar los datos del 
problema 9.6 para probar la hipótesis nula deque la altura media de los árboles es Igual a 5 pies (ft) contra la 
hipótesis alternativa de que la altura media es menor a 5 ft. Encontrar el valor p de esta prueba. 

SOLUCIÓN 

El valor encontrado paraz esz = (59.22 - 60)/1.01 = -0.77. El menor nivel de significancia al que se rechaza la hipóte¬ 
sis nula es el valor p = P(z < -0.77) = 0.5 - 0.2794 = 0.2206. La hipótesis nula se rechaza si el valor p es menor al nivel 
de significancia preestablecido. En este problema, si el nivel de significancia preestablecido es 0.05, no se rechaza la hipó¬ 
tesis nula. A continuación se presenta la solución que da M INITAB, donde el comando Al t e r na 11 ve -1 Indica que se 
trata de una prueba de la cola inferior. 


MTB> ZTe 

SUBOAI t 

s t me a n = 60 s d = 

er nati ve -1 

10.111 data 

i n c 1 ; 

Prueba Z 




Test of 
The as s u 

mu = 6 0.0 0 v s mu 
me d s i g ma = 10.1 

< 60.00 


Vari ab1 e 
hei ght 

N Mean 

100 59.22 

St Dev 

10. 11 

SE Mean 

1. 01 


10.8 Se toma una muestra de 33 personas que escuchen radio y se determina la cantidad de horas, por semana, que 
escuchan la radio. Los datos son los siguientes. 

987486887 10 8 10 67789 

658568785 58 76645 

Probar, de las siguientes tres maneras equivalentes, la hipótesis nula p, = 5 horas (h) contra la hipótesis alter¬ 
nativa ¿i ± 5 h al nivel de significancia a = 0.05: 

a) Calcular el valor del estadístico de prueba y compararlo con el valor crítico correspondiente a a = 0.05. 

b) Calcular el valor p del estadístico de prueba encontrado y comparar este valor p con a = 0.05. 

c) Calcular el Intervalo de confianza 1 - a = 0.95 para p y determinar si 5 cae dentro de este Intervalo. 
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SOLUCIÓN 

En el siguiente resultado de M INITAB se halla, primero, la desviación estándar y después se emplea en las declaraciones 
Ztest yZi nterval . 

MTB > standard deviation el 
Standard deviation of hours = 1.6005 

MTB > ZTest 5.01.6005 ‘ hours' ; 

SUBO Al t er nat i ve 0. 

Prueba Z 


Test 

0 

f mu = 

5. 000 

vs mu not 

= 5.000 




The 

as 

s u me d s 

i g ma 

= 1.60 





Va r 1 

a b 

1 e 

N 

Me a n 

St Dev 

SE Mean 

Z 

P 

h o u r 

s 


33 

6.897 

1. 600 

0.279 

6. 81 

0.0000 

MTB 

> 

Zl nt e r v 

al 95 

.01.6005 

' hours' 




Va r 1 

a b 

1 e 

N 

Me a n 

St Dev 

SE Mean 

95. 0 

% Cl 

h o u r 

s 


33 

6.897 

1. 600 

0.279 

( 6.351, 

7.443) 


6 897 _ 5 

a) El valor calculado para el estadístico de prueba es Z = — - = 6.81, los valores críticos son ±1.96, y la hipóte¬ 

sis nula se rechaza. Obsérvese que éste es el valor encontrado que aparece en el resultado de M IN ITAB. 

b) El valor p encontrado, de acuerdo con los resultados de M IN ITAB, es 0.0000, por lo tanto, el valor p < a = 0.05, la 
hipótesis nula se rechaza. 

c) Como el valor especificado por la hipótesis nula, 5, no está contenido en el intervalo de confianza de 95% para /i, la 
hipótesis nula se rechaza. 

Estos tres procedimientos para probar una hipótesis nula contra una de hipótesis alternativa de dos colas son 
equivalentes. 

10.9 La resistencia a la ruptura délos cables fabricados por una empresa tiene media de 1 800 libras (Ib) y desviación 
estándar de 100 Ib. Se asegura que mediante una nueva técnica puede aumentarse la resistencia a la ruptura. 
Para probar esto, se prueba una muestra de 50 cables y se encuentra que su resistencia media a la ruptura es 
1 850 Ib. ¿Puede apoyarse, a nivel de significancia 0.01, la aseveración hecha antes? 

SOLUCIÓN 

Se tiene que decidir entre las dos hipótesis siguientes: 

H 0 : fj, = 1 800 Ib, en realidad no hay cambio en la resistencia a la ruptura. 

H 1 : ft> 1 800 Ib, sí hay cambio en la resistencia a la ruptura. 

Por lo tanto, se debe usar una prueba de una cola; el diagrama correspondiente a esta prueba es idéntico al de la figura 10-4 
del problema 10.5a). A nivel de significancia 0.01, la regla de decisión es: 

Si la puntuación z observada es mayor a 2.33, los resultados son significativos a nivel de significancia 0.01 y H 0 se 
rechaza. 

Si no es así, H 0 se acepta (o la decisión se aplaza). 

Bajo la hipótesis de que H 0 es verdadera, se encuentra que 

X - u 1 850 - 1 800 

Z =- rL = - -== — = 3.55 

o/^JÑ 100/V5Ó 

que es mayor a 2.33. Por lo tanto, se concluye que los resultados son altamente significativos y que la aseveración hecha 
puede apoyarse. 
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VALORESpPARA PRUEBASDE HIPÓTESIS 

10.10 A un grupo de 50 compradores se le preguntó cuánto gastaba anualmente en sus compras por Internet. En la 
tabla 10.2 se muestran las respuestas. Se desea probar que gastan $325 por año contra una cantidad diferente a 
$325. Encontrar el valor p para la prueba de hipótesis. ¿A qué conclusión se llega empleando a = 0.05? 


Tabla 10.2 


418 

379 

77 

212 

378 

363 

434 

348 

245 

341 

331 

356 

423 

330 

247 

351 

151 

220 

383 

257 

307 

297 

448 

391 

210 

158 

310 

331 

348 

124 

523 

356 

210 

364 

406 

331 

364 

352 

299 

221 

466 

150 

282 

221 

432 

366 

195 

96 

219 

202 


SOLUCIÓN 


La media de estos datos es 304.60, la desviación estándar es 101.51, el estadístico de prueba obtenido es 


304.60 - 325 
101 . 50/\/50 


— 1 . 43 . 


El estadístico Z tiene aproximadamente una distribución normal estándar. El valorp calculado es el siguiente P (Z < -1 esta¬ 
dístico de prueba calculado |) oZ > | estadístico de prueba calculado |) o P(Z < - 1.43) + P(Z > 1.43). La respuesta puede 
hallarse usando el apéndice II o usando EXCEL. M ediante EXCEL, el valor p =2*NORM DIST(—1.43) = 0.1527, dado 
que la curva normal es simétrica y las áreas a la izquierda de -1.43 y a la derecha de 1.43 son iguales, se puede simple¬ 
mente duplicar en el área a la izquierda de -1.43. Como el valor p es menor a 0.05, no se rechaza la hipótesis nula. En la 
figura 10.6 se muestra gráficamente el valor p calculado en este problema. 



Z= —1.43 Z= 1.43 

Figura 10-6 El valor p es la suma del área a la izquierda deZ =-1.43 más que 
el área a la derecha deZ = 1.43. 

10.11 Volver al problema 10.10. Para analizar los datos usar el software para estadística de M INITAB. Obsérveseque 
el software da el valor p y al usuario se le deja la decisión respecto a la hipótesis de acuerdo con el valor que 
le haya asignado a a. 
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SOLUCIÓN 

Con la secuencia "Stat => Basic statistics => 1 sampleZ" se obtiene el análisis siguiente. El software calcula para el 
usuario el estadístico de prueba y el valor p. 

M uestra uno Z: cantidad 

Test of mu = 325 vs not = 325 

The assumed standard deviation = 101.51 

Variable N Mean StDev SE Mean Z P 

Amount 50 304.460 101.508 14.356 -1.43 0.152 

Obsérvese que el software proporciona el valor del estadístico de prueba (-1.43) y el valor p (0.152). 


10.12 En la tabla 10.3 se muestran los resultados de un estudio sobre individuos que emplean la computadora para 
hacer sus declaraciones de impuestos. Los datos de la tabla dan el tiempo que necesitan para hacer su declara¬ 
ción. La hipótesis nula esH 0 : // = 8.5 horas contra la hipótesis alternativa, que es H 1 : n < 8.5. Encontrar el 
valor p de esta prueba de hipótesis. ¿A qué conclusión llega empleando a = 0.05? 


Tabla 10.3 


6.2 

4.8 

8.9 

5.6 

6.5 

11.5 

8.6 

6.2 

8.5 

5.2 

2.7 

14.9 

11.2 

6.9 

7.9 

4.8 

9.5 

12.4 

9.7 

10.7 

8.0 

11.8 

7.4 

9.1 

4.9 

9.1 

6.4 

9.5 

7.6 

6.7 

2.6 

3.5 

6.4 

4.3 

7.9 

3.3 

10.3 

3.2 

11.5 

1.7 

10.4 

8.5 

10.8 

6.9 

5.3 

4.9 

4.4 

9.4 

5.6 

7.0 


SOLUCIÓN 

La media de los datos que se presentan en la tabla 10.3 es 7.42 h, la desviación estándar es 2.91 h y el estadístico de prue- 

y 42_35 

ba calculado es Z = ——— 7 = = -2.62. El estadístico Z tiene aproximadamente la distribución normal estándar. Con 
2.91/^50 

la secuencia de M INITAB "Cale => Probability distribution => Normal” se obtiene el cuadro de diálogo que se muestra 
en la figura 10-7. El cuadro de diálogo se llena como se indica. 

Los resultados que da el cuadro de diálogo de la figura 10-7 son los siguientes: 


Función de distribución acumulada 

Normal with mean = 0 and standard deviation = 1 

x P ( X <=x) 

-2.62 0.0043965 

El valor p es 0.0044 y como el valor p < a, se rechaza la hipótesis nula. Consultar la figura 10-8 para ver gráfica¬ 
mente el valor p obtenido en este problema. 
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Figura 10-7 Cuadro de diálogo para calcular el valor p si el estadístico de prueba es igual a -2.62. 



Figura 10-8 El valor pesel área a la izquierda deZ =-2.62. 


10.13 Refiérase al problema 10.12. Para analizar los datos usar el software para estadística SAS. Obsérvese que este 
software da el valor p y deja al usuario la decisión respecto de la hipótesis de acuerdo con el valor que el usua¬ 
rio haya asignado a a. 

SOLUCIÓN 

A continuación se presentan los resultados dados por SAS. El valor p se da como Prob > z = 0.0044, el mismo valor que 
se obtuvo en el problema 10.12. Este valor es el área bajo la curva normal estándar a la izquierda de -2.62. Comparar las 
demás cantidades dadas como resultados de SAS con las del problema 10.12. 

RESULTADOS DE SAS 

One Sa mpl e Z Test f or a Mean 
S a mp I e S t a t i s t i c s f o r t i me 

N Mean Std. Dev S t d Error 


50 


7. 42 


2.91 


0.41 
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Hypothesis Test 

Nuil hypothesis Mean of time => 8.5 

Al ternati ve Mean of time < 8.5 

wi th a specifled know standard devlation of 2.91 
Z St ati sti c Pr ob > Z 


-2.619 0.0044 

95% Confidence Interval for the Mean 
(Upper Bound Only) 

Lower Li mi t Upper Li mi t 


- i nf i ni t y 8.10 

Obsérvese que el intervalo unilateral de 95% (-oo, 8.10) no contiene el valor de la hipótesis nula, 8.5. Ésta es otra 
indicación de que la hipótesis nula se debe rechazar a nivel a = 0.05. 


10.14 Se asegura que el promedio de tiempo que escuchan M P3 las personas que utilizan estos dispositivos es 5.5 h 
por semana, contra un promedio mayor a 5.5. En la tabla 10.4 sedan las cantidades de tiempo que 50 personas 
pasan escuchando un M P3. Probar H 0 : n = 5.5 h contra la hipótesis alternativa /-/ x : p, > 5.5 h. Encontrar el 
valor p de esta prueba de hipótesis usando STATISTIX. ¿A qué conclusión se llega empleando a = 0.05? 


Tabla 10.4 


6.4 

6.4 

6.8 

7.6 

6.9 

5.8 

5.9 

6.9 

5.9 

6.0 

6.3 

5.5 

6.1 

6.4 

4.8 

6.3 

4.2 

6.2 

5.0 

5.9 

6.5 

6.8 

6.8 

5.1 

6.5 

6.7 

5.4 

5.9 

3.5 

4.4 

6.9 

6.7 

6.4 

5.1 

5.4 

4.7 

7.0 

6.0 

5.8 

5.8 

5.7 

5.2 

4.9 

6.6 

8.2 

6.9 

5.5 

5.2 

3.3 

8.3 


SOLUCIÓN 

STATISTIX proporciona los resultados siguientes: 

Statistix 8.0 

Des c r i pti ve St at i sti c s 

Variable N Mean SD 

MP 3 5 0 5.9 7 0 0 1.0 1 5 8 


El estadístico de prueba calculado es Z = — : - 1 — = 3.27. En la figura 10-9 se calcula el valor p. 

1.0158/^/50 

En la figura 10-10 se muestra gráficamente el valor p encontrado en este problema. 

El valor p encontrado es 0.00054 y como es menor a 0.05, se rechaza la hipótesis nula. 
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Figura 10-9 Cuadro de diálogo para hallar el valor p siendo el estadístico de prueba igual a 3.27. 



10.15 Empleando SPSS, usar la secuencia "Analyze=> Comparemeans=¿> one-samplettest” y los datos del pro¬ 
blema 10.14 para probar H 0 : n = 5.5 h contra la hipótesis alternativa H a : ¡j, > 5.5 h a a = 0.05 hallando el 
valor p y comparándolo con a. 

SOLUCIÓN 

Los resultados de SPSS son los siguientes: 


One-samplestatistics 



N 

M edia 

Desv. estándar 

M edia error estándar 

M PE 

50 

5.9700 

1.0184 

.14366 






























262 Capítulo 10 Teoría estadística de la decisión 


One-sampletest 



Valor de prueba = 5.5 





Diferencia 

Intervalo de 
confianza de 95% 
de la diferencia 


t 

gi 

Sigma (2 colas) 

media 

Inferior Superior 

M PE 

3.272 

49 

0.002 

.47000 

.1813 .7587 


En la primera parte de los resultados de SPSS se dan los estadísticos necesarios. Obsérvese que al estadístico de prueba 
encontrado se le llama ty no z. Esto se debe a que para n > 30, la distribución ty la distribución z son muy similares. 
La distribución t tiene un parámetro llamado grados de libertad que es Igual a n - 1. El valor p encontrado por SPSS es 
siempre un valor p para dos colas y se le conoce como slgma(2 colas). Este valor es Igual a 0.002. El valor para 1 cola 
es 0.002/2 = 0.001. Este valor es un valor cercano al encontrado en el problema 10.14 que es Igual a 0.00054. Cuando se 
usa un software, el usuario debe estar atento a la Idiosincrasia de ese software. 


GRÁFICAS DE CONTROL 

10.16 Para controlar el llenado de recipientes de mostaza se emplea una gráfica de control. La cantidad media de 
llenado es 496 gramos (g) y la desviación estándar es 5 g. Para determinar si la máquina llenadora está traba¬ 
jando en forma adecuada, cada hora, a lo largo de las 8 h del día, se toma una muestra de cinco recipientes. En 
la tabla 10.5 se presentan los datos de dos días. 

a) Diseñar una regla de decisión mediante la cual se pueda estar muy seguro de que la media de llenado se 
mantiene, durante estos dos días, en 496 g con una desviación estándar igual a 5 g. 

b) M ostrar cómo graficar la regla de decisión del inciso a). 


Tabla 10.5 


1 

2 

3 

4 

5 

6 

7 

8 

492.2 

486.2 

493.6 

508.6 

503.4 

494.9 

497.5 

490.5 

487.9 

489.5 

503.2 

497.8 

493.4 

492.3 

497.0 

503.0 

493.8 

495.9 

486.0 

493.4 

493.9 

502.9 

493.8 

496.4 

495.4 

494.1 

498.4 

495.8 

493.8 

502.8 

497.1 

489.7 

491.7 

494.0 

496.5 

508.0 

501.3 

498.9 

488.3 

492.6 


9 

10 

11 

12 

13 

14 

15 

16 

492.2 

486.2 

493.6 

508.6 

503.4 

494.9 

497.5 

490.5 

487.9 

489.5 

503.2 

497.8 

493.4 

492.3 

497.0 

503.0 

493.8 

495.9 

486.0 

493.4 

493.9 

502.9 

493.8 

496.4 

495.4 

494.1 

498.4 

495.8 

493.8 

502.8 

497.1 

489.7 

491.7 

494.0 

496.5 

508,0 

501.3 

498.9 

488.3 

492.6 


SOLUCIÓN 

a) Con una confianza de 99.73% puede decirse aue la media muestral x debe encontrarse en el intervalo de - 3 a x 
hasta ¡ja + 3o\. o bien, de: u - 3^ hasta: p + 3—=. Como p = 496, a = 5 y n = 5, se sigue que con una confianza 

V« V n 
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de 99.73% la media muestral debe estar en el intervalo de: 496 - 3-^= hasta: 496 + 3^= o bien entre 489.29 y 

Vs Vs 

502.71. Por lo tanto, la regla de decisión es la siguiente: 

Si la media muestral cae dentro del intervalo de 489.29 g a 502.71 g, se supone que la máquina está llenando 
correctamente. 

Si no es así, se concluye que la máquina de llenado no está trabajando en forma adecuada y se busca la razón 
por la que el llenado es Incorrecto. 

b ) Empleando una gráfica como la de la figura 10-11, IIamada gráfica de control de calidad, se puede llevar un registro 

délas medias muéstrales. Cada vez que se calcula una media muestral se representa mediante un punto. M ¡entras estos 
puntos se encuentren entre el límite inferior y el límite superior, el proceso está bajo control. SI un punto se sale de 
estos límites de control puede ser que algo esté mal y se recomienda hacer una investigación. 

Las 80 observaciones se Ingresan en la columna Cl. Con la secuencia "Stat => Control Charts=> Variablecharts 
for subgroups => Xbar" se abre la ventana de diálogo que, una vez llenada, da la gráfica de control que se muestra en la 
figura 10-11. 


G ráfica X barra de cantidad 



UCL=502.71 


X=496 


LCL=489.29 


Muestra 

Figura 10-11 G ráfica de control con límites 3o- para el control de la media de llenado 

de los envases de mostaza. 


Los límites de control especificados antes se conocen como límites de confianza del 99.73%, o simplemente, límites 
3a. También se pueden determinar otros límites de confianza (por ejemplo, límites del 99% o del 95%). En cada caso la 
elección depende de las circunstancias particulares. 

PRUEBAS PARA DIFERENCIAS DE ME DIAS Y PROPORCIONES 

10.17 A dos grupos de estudiantes, uno de 40 y el otro de 50 alumnos, se les puso un examen. En el primer grupo la 
puntuación media fue 74 y la desviación estándar 8; en el segundo grupo la puntuación media fue 78 y la des¬ 
viación estándar 7. ¿Existe diferencia en el desempeño de estos dos grupos a los niveles de significancia: a) 
0.05 y b) 0.01? 

SOLUCIÓN 

Supóngase que los dos grupos provienen dedos poblaciones cuyas medias son ^ y y¿ 2 , respectivamente. Entonces se debe 
decidir entre las hipótesis: 

H 0 : fj. 1 = fi 2 , la diferencia se debe únicamente a la casualidad. 

H 1 : ni* y. 2 , existe una diferencia significativa entre los dos grupos. 
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De acuerdo con la hipótesis H 0 , ambos grupos provienen de una misma población. La media y la desviación estándar de la 
diferencia entre las medias están dadas por 


Mát-z 2 — o y 


a Xl-X2 


ai 


Y2 — \ / T7" + TT" — \ + TX — 1.606 


Ni N, 


8 2 7 2 


40 50 


donde se han empleado las desviaciones estándar muéstrales como estimación de a 2 y a 2 . Por lo tanto, 


X, - X _ 74 - 78 
a x\-x2 1.606 


- 2.49 


a) En una prueba de dos colas, los resultados son significativos al nivel 0.05 si z se encuentra fuera del Intervalo de-1.96 
a 1.96. Por lo tanto, se concluye que al nivel de significancia 0.05 existe una diferencia significativa en el desempeño 
de estos dos grupos y que el segundo grupo parece ser mejor. 

b ) En una prueba de dos colas, los resultados son significativos al nivel 0.01 si z se encuentra fuera del Intervalo de-2.58 
a 2.58. Por lo tanto, se concluye que al nivel 0.01 no hay diferencia significativa entre las clases. 

Ya que los resultados son significativos al nivel 0.05 pero no al nivel 0.01, se concluye que los resultados sean pro¬ 
bablemente significativos (de acuerdo con la terminología presentada al final del problema 10.5). 


10.18 La estatura media de 50 estudiantes que mostraron una participación especial en las actividades deportivas de 
su escuela fue 68.2 pulgadas (in) con una desviación estándar de 2.5 ¡n, en tanto que la estatura media de 50 
estudiantes que no mostraron Interés en los deportes fue 67.5 ¡n con una desviación estándar de 2.8 ¡n. Probar 
la hipótesis de que los estudiantes que mostraron Interés en el deporte son más altos que el resto de los estu¬ 
diantes. 


SOLUCIÓN 


H ay que decidir entre las hipótesis: 

H 0 : p 1 = fj. 2 , no hay diferencia entre las estaturas medias. 

H l : p ti > m 2 , la estatura media del primer grupo es mayor que la del segundo grupo. 

Bajo la hipótesis H 0 , 


VX1-X2 — o y 




( 2 . 8) 2 

50 


0.53 


donde para estimar a 2 y a 2 se han empleado las desviaciones estándar muéstrales. Por lo tanto, 


Z 


X,-X 2 _ 68.2 - 67.5 
a xi-x 2 0-53 


Usando una prueba de una cola al nivel de significancia 0.05 se puede rechazar H 0 si la puntuación z es mayor a 1.645. Por 
lo tanto, en este caso, a ese nivel de significancia no se puede rechazar la hipótesis nula. 

Sin embargo, hay que observar que la hipótesis se puede rechazar al nivel de significancia 0.10 si se está dispuesto 
a correr el riesgo detener una probabilidad de 0.10 de cometer un error (es decir, 1 posibilidad en 10). 


10.19 Se realiza un estudio para comparar la media, en horas por semana, que usan sus celulares varones y mujeres 
estudiantes universitarios. De una universidad se tomaron 50 estudiantes mujeres y 50 estudiantes varones y se 
registró la cantidad de horas por semana que utilizan sus celulares. Los resultados se muestran en la tabla 10.6. 
Se quiere probar H 0 : ^ - p 2 = 0 contra H a : ^ - p 2 * 0, basándose en estas muestras. Usar EXCEL para 
calcular el valor p y llegar a una decisión acerca de la hipótesis nula. 
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Tabla 10.6 Horas por semana que usan su celular varones 
y mujeres estudiantes de una universidad 


Varones 

M ujeres 

12 

4 

11 

13 

11 

11 

9 

7 

10 

9 

7 

9 

10 

10 

7 

10 

10 

7 

9 

10 

7 

12 

6 

9 

15 

11 

8 

9 

6 

11 

10 

11 

12 

7 

8 

10 

7 

9 

12 

14 

8 

9 

11 

10 

9 

11 

12 

12 

8 

12 

10 

9 

9 

7 

9 

12 

9 

10 

11 

7 

11 

7 

10 

10 

11 

12 

7 

9 

8 

11 

9 

12 

12 

8 

13 

10 

8 

13 

8 

10 

9 

10 

8 

11 

10 

9 

9 

9 

11 

9 

13 

13 

9 

10 

13 

9 

8 

9 

12 

11 


SOLUCIÓN 

Los datos de la tabla 10.6 se ingresan en una hoja de cálculo de EXCEL como se muestra en la figura 10-12. Los datos 
de los varones se Ingresan en las cel das A 2: E11 y los datos de las mujeres en las celdas F2:J 11. La varianza de los datos de 
los varones se calcula ingresando en la celda A14 =VAR(A2:E 11). La varianza de los datos de las mujeres se calcula 
ingresando en la celda A15 =VAR(F2:J 11). La media de los datos de los varones se calcula ingresando en la celda 


O Microsoft Excel - Bookl 


SI File Edít View Insert Format Tools Data Window Help 


C Arial 

M8 - f* 



A B C D E 

F G H 1 J K 

1 

males 

Females 


2 

12 

4 

11 

13 

11 

11 

9 

7 

10 

9 


3 

7 

9 

10 

10 

7 

10 

10 

7 

9 

10 


4 

7 

12 

6 

9 

15 

11 

8 

9 

6 

11 


5 

10 

11 

12 

7 

8 

10 

7 

9 

12 

14 


6 

8 

9 

11 

10 

9 

11 

12 

12 

8 

12 


7 

10 

9 

9 

7 

9 

12 

9 

10 

11 

7 


8 

11 

7 

10 

10 

11 

12 

7 

9 

8 

11 


9 

9 

12 

12 

8 

13 

10 

8 

13 

8 

10 


10 

9 

10 

8 

11 

10 

9 

9 

9 

11 

9 


11 

12 

13 

13 

9 

10 

13 

9 

S 

9 

12 

11 













13 












14 

4.640408 

VAR(A2:E11) 









15 

3.153061 

VAR(F2:J11) 









16 

9.82 

AVERAGE(A2:E11) 









17 

9.7 

AVERAGE1F2:J11) 









18 


1 









19 

0.303949 

(A16-A17)/SQRT(A14/50+A15/50) 







20 


1 1 








21 

0.761167 

2*(1 -NORMSDISTIA19I) 









Figura 10-12 Hoja decálculo EXCEL para calcular el valor p del problema 10.19. 
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A16 =AVERAGE(A2:E11). La media de los datos de las mujeres se calcula ingresando en la celda A17 =AV ERA G E(F2: 
J11). El estadístico de prueba es =(A 16-A 17)/SQRT(A 14/50+A15/50) y se muestra en A19. Este estadístico tiene una 
distribución normal estándar y su valor es 0.304. La expresión =2*(1-NORM SDIST(A 19) calcula el área a la derecha de 
0.304 y la duplica. Con esto se obtiene que el valor p = 0.761. 

Como este valor p no es menor que ninguno de los valores a usuales, 0.01 o bien 0.05, no se rechaza la hipótesis 
nula. La probabilidad de obtener muestras como la obtenida es 0.761, suponiendo que la hipótesis nula sea verdadera. Por 
lo tanto, no hay evidencia que sugiera que la hipótesis nula es falsa y que se deba rechazar. 


10.20 Se tienen dos grupos de personas, A y 8, cada uno de 100 personas que padecen una enfermedad. AI grupo A 
se le administra un suero, pero al grupo 8 (que es el grupo control) no; por lo demás, los dos grupos se tratan 
en forma idéntica. En los grupos A y 8 se encuentra que 75 y 65 personas, respectivamente, se recuperan de 
esta enfermedad. A los niveles de significancia: a) 0.01, b) 0.05 y c) 0.10, probar la hipótesis de que el suero 
ayuda a la curación de la enfermedad. Calcular el valor p y mostrar que valor p > 0.01, valor p > 0.05, pero 
valorp < 0.10. 

SOLUCIÓN 

Sean p 2 y p 2 las proporciones poblacionales de las personas curadas: 1) usando el suero y 2) sin usar el suero, respectiva¬ 
mente. Hay que decidir entre las hipótesis: 

H 0 : pj = p 2 , las diferencias observadas se deben a la casualidad (es decir, el suero no es eficiente). 

H x : p 2 > p 2 , el suero sí es eficiente 

Bajo la hipótesis H 0 , 


Api-pi — 0 y a n _n - ^ jpq ( ; v, + ¿4) ~ ]i (0 - 70) (°- 30) (100 + 1 oo) - 0 0648 

donde, como estimación de p, se ha empleado la proporción promedio de curados en las dos muestras dada por (75 + 
65)/200 = 0.70, de donde q = 1 - p = 0.30. Por lo tanto, 

Pi-P, 0.750- 0.650 , 

z = —-- =-= 1.54 

o~p\_p2 0.0648 

Empleando una prueba de una cola al nivel de significancia 0 . 01 , la hipótesis H 0 se rechaza únicamente si la puntuación 
z es mayor a 2.33. Como la puntuación z es de sólo 1.54, se concluye que a este nivel de significancia los resultados 
se deben a la casualidad. 

Empleando una prueba de una cola al nivel de significancia 0.05, la hipótesis H 0 se rechaza únicamente si la puntuación 
i es mayor a 1.645. Por lo tanto, se concluye que a este nivel de significancia los resultados se deben a la casualidad. 
Si se usa una prueba de una cola al nivel de significancia 0.10, H 0 se rechaza sólo si la puntuación z es mayor a 1.28. 
Dado que esta condición se satisface, se concluye que el suero es eficiente al nivel 0.10. 

Empleando EXCEL, el valor p se obtiene mediante =l-NORM DIST(1.54), que es igual a 0.06178. Ésta es el área a 
la derecha de 1.54. Obsérvese que este valor es mayor a 0.01, 0.05, pero menor a 0.10. 

Nótese que la conclusión depende de qué tanto se está dispuesto a arriesgarse a estar equivocado. Si en realidad los 
resultados se deben a la casualidad, pero se concluye que se deben al suero (error tipo I), se procederá a administrar el suero 
a una gran cantidad de personas, con el único resultado de que en realidad no sea efectivo. Éste es un riesgo que no siempre 
se está dispuesto a asumir. 

Por otro lado, se puede concluir que el suero no ayuda, cuando en realidad sí lo hace (error tipo II). Esta conclusión 
es muy peligrosa, en especial porque lo que está enjuego son vidas humanas. 


a) 

b) 
0 
d) 


10.21 Repetí reí problema 10.20, pero considerando que cada grupo consta de 300 personas y que sanan 225 personas 
del grupo A y 195 del grupo 8. Encontrar el valorp usando EXCEL y comentar sobre su decisión. 
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SOLUCIÓN 

Obsérvese que la proporción de personas que sana en cada grupo es 225/300 = 0.750 y 195/300 = 0.650, respectivamen¬ 
te, que son las mismas que en el problema 10.20. De acuerdo con la hipótesis H 0 

^pi-p2 = o y + = \/ (0 - 70)(0 - 30) (¿ó + ¿j) = 0 - 0374 

donde (225 + 195)/600 = 0.70 se usa como estimación dep. Por lo tanto, 

P\ - P 2 0.750 - 0.650 

z =-=-= 2.67 

íj pi—p2 0.0374 

Como el valor dez es mayor que 2.33, la hipótesis nula se puede rechazar al nivel de significancia 0.01; es decir, se puede 
concluir que el suero es efectivo con una probabilidad de estar equivocado de sólo 0.01. 

Esto muestra cómo al aumentar el tamaño de la muestra se incrementa la confiabilidad de las decisiones. Sin embar¬ 
go, en muchos casos suele no ser posible aumentar el tamaño de la muestra. En esos casos se está forzado a tomar las 
decisiones con base en la información disponible, y por lo tanto se debe conformar con correr mayor riesgo de tomar una 
decisión incorrecta. 

valor p =1-NORM DIST(2.67) = 0.003793. Esto es menor a 0.01. 

10.22 Se realizó un sondeo en una muestra de 300 votantes del distrito A y 200 votantes del distrito 8; se encontró 
que 56 y 48%, respectivamente, estaban a favor de determinado candidato. Al nivel de significancia 0.05, 
probar las hipótesis: a) existe diferencia entre los distritos, b) el candidato se prefiere en el distrito A y c) 
calcular el valor p de los Incisos a) y b). 

SOLUCIÓN 

Sean p 2 y p 2 las proporciones de todos los votantes de los distritos A y B que están a favor de este candidato. Bajo la hipó¬ 
tesis H 0 :p 1 = p 2 , se tiene 

mpi— p 2 = 0 v "n-n = = ^/ (0 - 528)(0 - 472) (¿ + ¿) = 0 - 0456 

donde se emplean los valores [(0.56)(300) + (0.48)(200)]/500 = 0.528 y (1 - 0.528) = 0.472 como estimaciones dep y 
q, respectivamente. Por lo tanto, 

_ P, - P 2 _ 0.560 - 0.480 _ ( ?5 
<T/)| p 2 0.0456 

a) Si sólo se desea determinar si existe alguna diferencia entre los distritos, hay que decidir entre las hipótesis H 0 :p 1 = 
p 2 yH 1 :p 1 *p 2 , lo que implica una prueba dedos colas. Usando una prueba de dos colas al nivel de significancia 0.05, 
H 0 se puede rechazar si z está fuera del intervalo -1.96 a 1.96. Como z = 1.75 se encuentra en este intervalo, a este 
nivel no se puede rechazar H 0 ; esto es, no hay diferencia significativa entre los dos distritos. 

b) Si se desea determinar si el candidato es preferido en el distrito A, hay que decidir entre las hipótesis H 0 : p 1 = p 2 y 
H 1 :p 1 >p 2 , lo que implica una prueba deuna cola. U sando una prueba deuna cola al nivel de significancia 0.05, H 0 
se rechaza si z es mayor a 1.645. Dado que éste es el caso, se rechaza H 0 a este nivel de significancia y se concluye 
que el candidato es preferido en el distrito A. 

c) Con la alternativa de dos colas, el valor p =2*(l-NORM DIST(1.75)) = 0.0801. A a = 0.05 no se puede rechazar la 
hipótesis nula. Con la alternativa de una cola, valor p =l-l\IORM DIST(1.75) = 0.04006. A a = 0.05 se puede recha¬ 
zar la hipótesis nula. 

PRUEBAS EM PLEANDO DISTRIBUCIONES BINOM IALES 

10.23 U n profesor aplica un pequeño examen en el que hay 10 preguntas de verdadero o falso. Para probar la hipó¬ 
tesis deque los alumnos contestan sólo adivinando, el profesor adopta la siguiente regla de decisión: 

SI hay siete o más de las respuestas correctas, el estudiante no está sólo adivinando. 

Si hay menos de siete respuestas correctas, el estudiante está sólo adivinando. 
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Encontrar la probabilidad de rechazar la hipótesis nula cuando ésta sea correcta: a) empleando la distribución 
blnomlal y b) empleando EXCEL. 

SOLUCIÓN 

a) Sea p la probabilidad de que una pregunta se responda correctamente. La probabilidad de tener X de 10 preguntas 
correctas es {™)p x q m ~ x , donde q = 1 - p. Entonces bajo la hipótesisp = 0.5 (es decir, el estudiante está sólo atinan¬ 
do), 


Pr{7 o más correctas} = Pr{7 correctas} + Pr{8 correctas} + Pr{9 correctas} + Pr{10 correctas} 



Por lo tanto, la probabilidad de concluir que el estudiante no está sólo adivinando cuando en realidad sí lo esté haciendo es 
0.1719. Obsérvese que ésta es la probabilidad de un error tipo I. 

b) Los números 7,8,9 y 10 se ingresan en A1;A4 de la hoja de cálculo de EXCEL. Después se ingresa =BINOM DIST (A 1, 
10,0.5,0). A continuación se hace clic y se arrastra desde B1 hasta B4. En B5 se ingresa =SU M (B 1:B4). La respuesta 
aparece en B5. 


A B 

7 0.117188 

8 0.043945 

9 0.009766 

10 0.000977 

0.171875 


10.24 En el problema 10.23, encontrar la probabilidad de aceptar la hipótesis p = 0.5 cuando en realidad p = 0.7. 
Encontrar la respuesta: a) usando la fórmula de probabilidad blnomial y b) usando EXCEL. 

SOLUCIÓN 


a) Bajo la hipótesisp = 0.7, 

Prfmenos de 7 correctas} = 1 - Pr{7 o más correctas} 


= 1 


(0.7) 7 (0.3) 3 + 


10 


(0.7) 8 (0.3) 2 + n (0.7) 9 (0.3) + 


(0.3) 1 


= 0.3504 


b ) La solución usando EXCEL es: 

Prfmenos de 7 correctas cuando p = 0.7} está dada por =BINOM DIST (6,10,0.7,1) que es igual a 0.350389. El 1 
en la función BINOM DIST Indica que la probabilidad, correspondiente a n = 10 y p = 0.7, desde 0 hasta 6 está acumu¬ 
lada. 


10.25 En el problema 10.23, encontrar la probabilidad de aceptar la hipótesisp =0.5 cuando en realidad: a) p = 0.6, 
b) p = 0.8, c) p = 0.9, d)p = 0.4, e) p = 0.3, f) p = 0.2 y g) p = 0.1. 

SOLUCIÓN 


a) Si p = 0.6, 

Probabilidad buscada = 1 - [Pr{7 correctas} + Pr{8 correctas} + Pr{9 correctas} + Pr{10 correctas}] 


= 1 


(0.6) 7 (0.4) 3 + 


10 


(0.6) s (0.4) 2 +( 1 n °)(0.6) 9 (0.4) + 


( 0 . 6) 1 


= 0.618 
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Los resultados de los incisos b ) a g ) se encuentran de manera similar y se presentan en la tabla 10.7, junto con los 
correspondientes valores desde p = 0.5 hasta p = 0.7. Obsérvese que en la tabla 10.7 la probabilidad se denota por ^(pro¬ 
babilidad de cometer un error tipo II); la entrada p correspondiente a p = 0.5 está dada por p = 1 - 0.1719 = 0.828 (de 
acuerdo con el problema 10.23) y la entrada p correspondiente a p = 0.7 se tomó del problema 10.24. 


Tabla 10.7 


p 

0.1 

0.2 

0.3 

0.4 

0.5 

0.6 

0.7 

0.8 

0.9 

p 

1.000 

0.999 

0.989 

0.945 

0.828 

0.618 

0.350 

0.121 

0.013 


10.26 Usar el problema 10.25 para construir una gráfica de p contra p. 

SOLUCIÓN 

La gráfica buscada se muestra en la figura 10-3. 



P 

Figura 10-13 G ráfica para los errores tipo 11 en el problema 10.25. 


10.27 La hipótesis nula es que un dado no está cargado y la hipótesis alternativa es que el dado sí está cargado, de 
manera que la cara seis aparece con más frecuencia de la que debería. Esta hipótesis se prueba lanzando el dado 
18 veces y observando cuántas veces cae seis. Encontrar el valor p si la cara seis se presenta 7 veces en 18 
lanzamientos del dado. 

SOLUCIÓN 

En la hoja de cálculo de EXCEL se ingresan en A 1:A 19 los números del 0 al 18. En B1 se ingresa =BINOM DIST (A 1,18, 
0.16666,0), se hacedle y se arrastra desde B1 hasta B19 para obtener cada una de las probabilidades blnomlales, en C1 se 
ingresa =BINOM DIST (A 1,18,0.16666,1), se hace clic y se arrastra desde C1 hasta C19 con lo que se obtiene la probabi¬ 
lidad binomlal acumulada. 
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A 

B 

C 

0 

0.037566 

0.037566446 

1 

0.135233 

0.17279916 

2 

0.229885 

0.402683738 

3 

0.245198 

0.647882186 

4 

0.18389 

0.831772194 

5 

0.102973 

0.934745656 

6 

0.04462 

0.979365347 

7 

0.015297 

0.994662793 

8 

0.004207 

0.998869389 

9 

0.000935 

0.999804143 

10 

0.000168 

0.999972391 

11 

2.45E-05 

0.999996862 

12 

2.85E-06 

0.999999717 

13 

2.64E-07 

0.99999998 

14 

1.88E-08 

0.999999999 

15 

1E-09 

1 

16 

3.76E-11 

1 

17 

8.86E-13 

1 

18 

9.84E-15 

1 


El valor p es p{x > 7} = 1 - P{X < 6} = 1 - 0.979 = 0.021. El resultado X = 6 es significativo a a 
a = 0.01. 


0.05, pero no a 


10.28 Para probar que 40% de las personas que pagan impuestos emplean algún software para el cálculo délos mis¬ 
mos contra la hipótesis alternativa de que el porcentaje es mayor a 40%, se seleccionan en forma aleatoria 300 
personas que pagan impuestos y se les pregunta si emplean algún software. Si 131 de las 300 emplea algún 
software, encontrar el valor p correspondiente a esta observación. 



Figura 10-14 C uadro de diálogo de la distribución binomial para calcular 130 
o menos de 300 usuarios de software, dado que 40% de los que pagan impuestos 

usan algún software. 
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SOLUCIÓN 

La hipótesis nula es H 0 :p = 0.4 y la hipótesis alternativa H a : p > 0.4. El valor deX observado es 131, dondeX es la can¬ 
tidad de los que usan algún software. El valor p = P{X > 131 dado que p = 0.4}. El valor p = 1 - P{X < 130 dado que 
p = 0.4}. Empleando M INITAB, con la secuencia "Cale => Probability Distribution => Binomial" se abre el cuadro de 
diálogo que se muestra en la figura 10-14. 

Con el cuadro de diálogo de la figura 10-14 se obtiene el resultado siguiente. 


Función de distribución acumulada 

B i n o mi al wi t h n =3 0 0 and p=0. 4 


x P ( X<=x) 

130 0.891693 

El valor p es 1 - P{X < 130 dado quep = 0.4} = 1 - 0.8971 = 0.1083. El resultadoX = 131 no es significativo a 
0.01,0.05 ni 0.10. 


PROBLEMAS SUPLEMENTARIOS 

PRUEBAS PARA MEDIASY PARA PROPORCIONES 
EMPLEANDO DISTRIBUCIONES NORMALES 

10.29 U na urna contiene sólo canicas azules y rojas. Para probar la hipótesis nula deque las canicas de ambos colores se encuen¬ 
tran en la misma proporción, se toma una muestra, con reposición, de 64 canicas; se anotan los colores de las canicas que 

se van extrayendo y se adopta la siguiente regla de decisión: 

La hipótesis nula se acepta si 28 < X < 36, dondeX es la cantidad de canicas rojas en la muestra de tamaño 64. 

La hipótesis nula se rechaza si X < 27 o si X > 37. 

a) Encontrar la probabilidad de rechazar la hipótesis nula si es correcta. 

b ) Graficar la regla de decisión y el resultado que se obtenga en el inciso a). 

10.30 a) ¿Qué regla de decisión se adopta en el problema 10.29 si lo que se busca es que la probabilidad de rechazar la hipóte¬ 

sis nula siendo en realidad correcta no sea mayor a 0.01 (es decir, si se quiere que el nivel de significancia sea 0.01)? 

b) ¿A qué nivel de confianza se puede aceptar la hipótesis nula? 

c) ¿Cuál es la regla de decisión si se emplea como nivel de significancia 0.05? 

10.31 Supóngase que en el problema 10.29 se desea probar la hipótesis de que la proporción de canicas rojas es mayor que la de 
canicas azules. 

a) ¿Cuál es entonces la hipótesis nula y cuál la hipótesis alternativa? 

b) ¿Se debe usar una prueba de una cola o de dos colas? ¿Por qué? 

c) ¿Cuál debe ser la regla de decisión si el nivel de significancia es 0.05? 

d) ¿Cuál es la regla de decisión si el nivel de significancia es 0.01? 

10.32 Se lanzan 100 veces un par de dados y en 23 de las veces aparece un 7. AI nivel de significancia 0.05, probar la hipótesis 
deque los dados no están cargados empleando; a) una prueba de dos colas y ib) una prueba de una cola. Analizar las razones, 
si es que las hay, para preferir una de estas dos pruebas. 

10.33 Repetir el problema 10.32 empleando como nivel de significancia 0.01. 
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10.34 U n fabricante asegura que por lo menos el 95% de los equipos que vende a una fábrica satisfacen las especificaciones. En 
una muestra de 200 equipos examinados, 18 no cumplen con las especificaciones. Probar la afirmación del fabricante a los 
niveles de significancia: a) 0.01 y b) 0.05. 

10.35 Se afirma que los compradores por Internet gastan en promedio $335 por año. Se desea probar que esta cantidad no es la 
correcta empleando a = 0.075. Se hace un estudio en el que intervienen 300 compradores por Internet y se encuentra que 
la media muestral es $354 y la desviación estándar es $125. Encontrar el valor del estadístico de prueba, los valores críticos 
y efectuar la conclusión. 

10.36 Por experiencia se sabe que la resistencia a la ruptura de determinada marca de hilo es 9.72 onzas (oz) y su desviación 
estándar es 1.40 oz. En una muestra reciente de 36 piezas de este hilo se encuentra que la resistencia media a la ruptura es 
8.93 oz. Probar la hipótesis nulaH 0 : ¿¿ = 9.72 contra la hipótesis alternativa H 0 : p < 9.72 y dar el valor del estadístico de 
prueba y el valor crítico que corresponde a: a) a = 0.10 y b) a = 0.025. ¿Es este resultado significativo a a = 0.10? ¿Es 
este resultado significativo a a = 0.025? 

10.37 Se realiza un estudio para probar la hipótesis nula deque la cantidad media de correos electrónicos enviados semanal men¬ 
te por los empleados en una ciudad grande es 25.5 contra la hipótesis alternativa de que esta cantidad es mayor a 25.5. Se 
entrevista a 200 empleados de toda la ciudad y se encuentra que* = 30.1 y s = 10.5. Dar el valor del estadístico de prueba 
y el valor crítico para a = 0.03, y efectuar la conclusión. 

10.38 Para una n grande (n > 30) y una desviación estándar conocida se usa la distribución normal estándar para realizar una 
prueba acerca de la media de la población de la que se toma la muestra. A la hipótesis alternativa H a : p < p Q se \e 
llama alternativa déla cola Inferior y a la hipótesis alternativa H a : p> p 0 se le llama alternativa déla cola superior. Para 
una alternativa de la cola superior, dar la expresión de EXCEL para el valor crítico si a = 0.1, a = 0.01 y a = 0.001. 


VALORES p EN PRUEBAS DE HIPÓTESIS 

10.39 Para probar que una moneda está balanceada se lanza 15 veces y se obtienen 12 caras. Dar el valorp correspondiente a este 
resultado. Para hallar el valor p emplear BINOMDIST de EXCEL. 

10.40 Dar el valorp correspondiente al resultado del problema 10.35. 

10.41 Dar el valorp correspondiente al resultado del problema 10.36. 

10.42 Dar el valorp correspondiente al resultado del problema 10.37. 

GRÁFICAS DE CONTROL DE CALIDAD 

10.43 Cierto tipo de hilo producido por un fabricante ha tenido una resistencia a la ruptura de 8.64 oz y una desviación estándar 
de 1.28 oz. Para determinar si este producto satisface los estándares, cada tres horas se toma una muestra de 16 piezas y se 
determina la media de su resistencia al rompimiento. En una gráfica de control de calidad, registrar los límites de control 
de: a) 99.73% (o 3a), b ) 99% y c) 95%, y explicar sus aplicaciones. 

10.44 En promedio, cerca del 3% de los pernos que produce una empresa están defectuosos. Para mantener esta calidad cada 
cuatro horas se toma una muestra de 200 pernos y se examina. Determinar los límites de control de: a) 99% y b) 95% para 
la cantidad de pernos defectuosos en cada muestra. Obsérvese que en este caso sólo se necesitan los límites superiores de 
control. 


PRUEBAS PARA DIFERENCIAS DE ME DIAS Y PROPORCIONES 

10.45 En un estudio se compara la vida media, en horas, dedos tipos de focos. Los resultados del estudio se muestran en la tabla 
10 . 8 . 
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Tabla 10.8 



Foco 

ecológico 

Foco 

tradicional 

n 

75 

75 

M edia 

1250 

1305 

D esv. est. 

55 

65 


Probar H 0 : ^ - ¿¿ 2 = 0 contra H a : - n 2 # 0 con am 0.05. Dar el valor de la prueba estadística y calcular el 

valor dep y comparar el valor p con a = 0.05. Proporcionar su conclusión. 

10.46 En un estudio se comparan las calificaciones de 50 estudiantes universitarios que tienen televisión en su dormitorio con las 
de 50 estudiantes universitarios que no tienen televisión en su dormitorio. Los resultados se muestran en la tabla 10.9. La 
hipótesis alternativa es que la media de las calificaciones de los universitarios que no tienen televisión en su dormitorio es 
mayor a la de los que sí la tienen. Dar el valor del estadístico de prueba suponiendo que no haya diferencia entre las califi¬ 
caciones. Dar el valor p y las conclusiones para a = 0.05 y para a = 0.10. 


Tabla 10.9 



Televisión en 
el dormitorio 

Sin 

televisión 

n 

50 

50 

M edia 

2.58 

2.77 

D esv. est. 

0.55 

0.65 


10.47 En un examen de ortografía en una escuela primaria, la calificación promedio de 32 niños fue de 72 puntos y su desviación 
estándar de 8 puntos, y la calificación promedio de 36 niñas fue de 75 puntos y su desviación estándar de 6 puntos. La 
hipótesis alternativa es que las niñas son mejores en ortografía que los niños. Dar el valor del estadístico de prueba supo¬ 
niendo que entre niños y niñas no hay diferencia en la calificación de ortografía. Dar el valor p y la conclusión para a = 
0.05 y para a = 0.10. 

10.48 Para probar los efectos de un nuevo fertilizante sobre la producción de trigo se dividió una parcela en 60 cuadrados de la 
misma área, todos de idéntica calidad en términos de suelo, exposición a la luz, etc. En 30 de los cuadrados se empleó el 
nuevo fertilizante y el fertilizante viejo se usó en el resto de los cuadrados. La cantidad media de bushels (bu) de trigo, 
usando el nuevo fertilizante, cosechado por cuadrado, fue de 18.2 bu y su desviación estándar de 0.63 bu. La media y la 
desviación estándar correspondientes en el caso en que se usó el fertilizante viejo fueron 17.8 y 0.54 bu, respectivamente. 
Empleando como niveles de significancia: a) 0.05 y b ) 0.01, probar la hipótesis de que el nuevo fertilizante es mejor que 
el viejo. 

10.49 En muestras aleatorias de 200 remaches elaborados con la máquina A y 100 remaches elaborados con la máquina B se 
encontraron 19 y 5 remaches defectuosos, respectivamente. 

a) Dar el estadístico de prueba, el valor p, y su conclusión a a = 0.05 para probar que las dos máquinas tienen diferente 
calidad de desempeño. 

b) Dar el estadístico de prueba, el valor p y la conclusión a a = 0.05 para probar que la máquina B es mejor que la 
máquina A. 

10.50 Dos urnas, A y B, contienen la misma cantidad de canicas, pero no se sabe cuál es la proporción de canicas rojas y canicas 
blancas en cada una de ellas. De cada una se toma una muestra, con reposición, de 50 canicas. En las 50 canicas de la urna 
A hay 32 rojas y en las 50 canicas de la urna B hay 23 rojas. 
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a) Empleando a = 0.05, probar la hipótesis de que la proporción de canicas rojas es la misma en las dos urnas, contra la 
hipótesis de que es diferente; dar el estadístico de prueba calculado, el valor p calculado y la conclusión. 

b ) Empleando a = 0.05, probar la hipótesis de que la urna A tiene una proporción mayor de canicas rojas que la urna B; 
dar el estadístico de prueba calculado, el valor p calculado y la conclusión. 

10.51 Para determinar si una moneda está cargada, de manera que al lanzarla sea más probable que aparezca cara que cruz, se 
lanza 15 veces. SeaX = cantidad de caras en los 15 lanzamientos. Se declarará que la moneda está cargada a favor de cara 
si X > 11. Usar EXCEL para hallar a. 

10.52 Se lanza una moneda 20 veces para determinar si está cargada. Se declarará cargada si X = 0,1, 2,18,19, 20, dondeX = 
cantidad de cruces obtenidas. Usar EXCEL para hallar a. 

10.53 Se lanza una moneda 15 veces para determinar si está cargada, de manera que al lanzarla sea más probable que aparezca 
cara que cruz. SeaX = cantidad de caras en los 15 lanzamientos. Se declarará cargada a favor de cara si X > 11. Usar 
EXCEL y encontrar/3sí p = 0.6. 

10.54 Se lanza una moneda 20 veces para determinar si está cargada. Se declarará cargada si X = 0,1, 2,18,19, 20, dondeX = 
cantidad de cruces obtenidas. Usar EXCEL para hallar /3si p = 0.9. 

10.55 Se lanza una moneda 15 veces para determinar si está cargada, de manera que al lanzarla sea más probable que aparezca 
cara que cruz. SeaX = cantidad de caras en los 15 lanzamientos. Se declarará cargada a favor de cara si X > 11. Encontrar 
el valor p correspondiente al resultado X = 10. Comparar el valor p con el valor de a en este problema. 

10.56 Se lanza una moneda 20 veces para determinar si está cargada. Se declarará cargada si X = 0,1,2, 3,4,16,17,18,19 y 20, 
dondeX = cantidad de cruces obtenidas. Encontrar el valor p correspondiente al resultado X = 17. Comparar el valorp con 
el valor de a en este problema. 

10.57 En una línea de producción se fabrican teléfonos celulares. Tres por ciento de defectuosos se considera aceptable. De la 
producción diaria se selecciona una muestra de 50. Si en la muestra se encuentran más de tres defectuosos, se considera 
que el porcentaje de defectuosos se ha excedido del 3% y la línea de producción se detiene hasta que se satisfaga el 3%. 
Emplear EXCEL para determinar a. 

10.58 En el problema 10.57 encontrar la probabilidad de que 4% de defectuosos no haga que se detenga la línea de producción. 

10.59 Para determinar si un dado está balanceado se lanza 20 veces. Se declarará que no está balanceado porque el 6 aparece más 
de 1/6 de las veces si en 20 lanzamientos se obtienen más de 5 seises. Hallar el valor de a. SI se lanza el dado 20 veces y 
se obtienen 6 seises, hallar el valor p correspondiente a este resultado. 


TEORÍA DE 
LAS MUESTRAS 
PEQUEÑAS 



En los capítulos anteriores con frecuencia se utilizó el hecho de que si el tamaño de las muestras es grande, N > 30, lo 
que se conoce como muestras grandes, las distribuciones muéstrales de muchos de los estadísticos son aproximada¬ 
mente normales; esta aproximación mejora a medida que aumenta N. SI el tamaño de las muestras es N < 30, lo que 
se conoce como muestras pequeñas, esta aproximación no es buena y empeora a medida que N disminuye, de manera 
que es necesario hacer algunas modificaciones. 

Al estudio de las distribuciones muéstrales de los estadísticos, cuando las muestras son pequeñas, se le llama teoría 
de las muestras pequeñas. Sin embargo, un nombre más adecuado sería teoría del muestreo exacto, ya que los resul¬ 
tados obtenidos son válidos tanto para muestras grandes como para muestras pequeñas. En este capítulo se estudian 
tres distribuciones Importantes: la distribución t de Student, la distribución ji cuadrada y la distribución F. 

DISTRIBUCIÓN (DE STUDENT 

Sea el estadístico 


t = ?-^y/N- 1 
s 


X-n 

s/VÑ 


(1) 


que es análogo al estadístico z dado por 


X-n 

o/\TÑ 


SI se consideran muestras de tamaño N extraídas de una población normal (o aproximadamente normal) cuya media 
es ¡i y si para cada muestra se calcula t, usando la media muestral Xy la desviación estándar muestral s o s, se obtiene 
la distribución muestral de t. Esta distribución (ver figura 11-1) está dada por 


Y = 


y o 

?2 y/> 

N-l) 


Y 0 



H-i)/2 


( 2 ) 


275 
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Figura 11-1 a) Curva normal estándar, b) tdeStudent para v =5, c) tdeStudent para v = 1. 


dondeY 0 esuna constante que depende de W, tal que el área total bajolacurva sea 1, y donde a la constante v= (N - 1) 
se le conoce como el número de grados de libertad (¡yes la letra griega nu). 

A la distribución (2) se le llama distribución t de Student en honor a su descubridor, W. S. Gossett, quien en la 
primera mitad del siglo xx publicó sus trabajos bajo el seudónimo "Student". 

Si los valores de v o de N son grandes (N > 30), la curva (2) se aproxima a la curva normal estándar 

7 = ~¡= e-^ 


como se muestra en la figura 11-1. 


INTERVALOS DE CONFIANZA 


Como se hizo en el capítulo 9 con las distribuciones normales, se pueden definir Intervalos de confianza de 95%, 99% 
u otros Intervalos usando la tabla de la distribución t que aparece en el apéndice III. De esta manera puede estimarse 
la media poblacional dentro de determinados límites de confianza. 

Por ejemplo, si -t 975 y t 975 son los valores de t para los cuales 2.5% del área se encuentra repartida en cada una de 
las colas déla distribución t, entonces el Intervalo de confianza para t de 95% es 

~t 97 5 < -V 'N — 1 < t 9 7 5 (3) 

S 

a partir de lo cual se puede estimar que /i se encuentra en el Intervalo 

x ~ ¿975 . , < < X + 1 975 (4) 

ViV - 1 y/N - 1 

con una confianza de 95% (es decir, con una probabilidad de 0.95). Obsérvese que t 975 representa el valor del percen- 
til 97.5, y que t 025 = -t 975 representa el valor del percenti I 2.5. 

En general, los límites de confianza para la media poblaclonal se representan mediante 


X±t c 


s 


(5) 


donde los valores ±t c , llamados valores críticos o coeficientes de confianza, dependen del nivel de confianza deseado 
y del tamaño déla muestra. Estos valores se leen en el apéndice III. 

Se supone que la muestra se toma de una población normal. Esta suposición se puede verificar empleando la prue¬ 
ba para normalidad de Kolmogorov-Smlrnov. 
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Comparando la ecuación (5) con los límites de confianza (X ± z c a/y/Ñ) dados en el capítulo 9, se ve que cuando 
se tienen muestras pequeñas z c (que se obtienen de la distribución normal) se sustituye por t c (que se obtiene de la 
distribución t) y que cr se sustituye por S /N/{N - l),s = S, que es la estimación decr. A medida que/V aumenta, ambos 
métodos tienden a coincidir. 


PRUEBASDE HIPÓTESISY DE SIGNIFICANCIA 


Las pruebas de hipótesis y de significancia, o reglas de decisión (vistas en el capítulo 10), pueden extenderse fácil men¬ 
te a problemas con muestras pequeñas; la única diferencia es que la puntuación z, o estadístico z, se sustituye por la 
puntuación t o estadístico t apropiado. 

1. Media. Para probar la hipótesis H 0 deque una población normal tiene una media //, se usa la puntuación t (o esta¬ 
dístico t) 

í = = (6) 
5 S 

donde X es la media de una muestra de tamaño N. Esto es análogo a usar la puntuación z 

_ X-II 
u/y/Ñ 

para una N grande, salvo que se usa s = y/N/(N - l)s en lugar de cr. La diferencia es que mientras z está distri¬ 
buida normalmente, t sigue una distribución de Student. A medida que N aumenta, estas distribuciones tienden a 
coincidir. 


2 . 


Diferencias entre medias. Supóngase que de poblaciones normales cuya desviaciones estándar son ¡guales (c^ = 
cr 2 ) se toman dos muestras aleatorias de tamaños N 1 y N 2 . Supóngase, además, que las medias de estas dos muestras 
son X¡ y X 2 y que sus desviaciones estándar son s : y s 2 , respectivamente. Para probar la hipótesis H 0 de que las 
muestras provienen de una misma población (es decir que ¡x x = ¿¿ 2 y también cr 1 = cr 2 ) se usa la puntuación tdada 
por 


X\-X 2 

cr \J\/N\ + 1/N 2 


donde 


cr = 


Nrf + N 2 s\ 
N x + N 2 - 2 


(7) 


Esta distribución t ti ene una distribución de Student con v = N 1 + N 2 -2 grados de libertad. El uso déla ecuación 
(7) se hace plausible al hacer 0 ^ = cr 2 = cr en la puntuación z de la ecuación (2) del capítulo 10 y después usar como 
estimación decr 2 la media ponderada 


(N x — l)i 2 + (N 2 — l)s 2 __ + N 2 s 2 

(N x - 1) + (N 2 — 1) ~N x +N 2 -2 


donde s 2 x y f 2 son estimadores insesgados de o\ y a\. 


DISTRIBUCIÓN J I CUADRADA 

Sea el estadístico 

2 Ns 2 (Xi-X) 2 + (X 2 -X) 2 + --- + (X n -X) 2 

X = — = - 2 - 

cr cr“ 

donde x es la letra griega ji y x 2 se lee "ji cuadrada". 

SI se consideran muestras de tamaño N obtenidas de una población normal cuya desviación estándar es <r, y si para 
cada muestra se calcula x 2 , se obtiene una distribución muestral de x 2 - Esta distribución, llamada distribución ji 
cuadrada, está dada por 

Y = Yq (x 2 ) (1/2){ "- 2) = Y^~ 2 e-^ 


(9) 
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donde v = N - 1 es el número de grados de libertad y Y 0 es una constante que depende de v, de manera que el área 
bajo la curva sea 1. En la figura 11-2 se presentan distribuciones]i cuadrada correspondientes a diversos valores de v. 
El valor máximo de Y se obtiene cuando x 2 = v - 2 para v > 2. 



Figura 11-2 Distribuciones j¡ cuadrada correspondientes a: a) 2, b) 4, c) 6 y d) 10 grados de libertad. 


INTERVALOS DE CONFIANZA PARA <r 


Como se hizo con la distribución normal y con la distribución t, pueden definirse límites de confianza de 95%, 99%, 
u otros límites empleando la tabla de distribución x 2 que se presenta en el apéndice IV. De esta manera puede estimar¬ 
se la desviación estándar poblaclonal eren términos de la desviación estándar muestral dentro de determinados límites 
de confianza. 

Por ejemplo, si xmsY 2Y 2 915 son los valores de x 2 (llamados valores críticos), tales que 2.5% del área se encuentra 
repartida en ambas colas de la distribución, entonces el Intervalo de confianza de 95% es 

2 dVs 2 nn\ 

x: 0 25 < — <X975 ( 10 > 

<7 


de donde se ve que puede estimarse que a se encuentra en el Intervalo 

sVÑ sVÑ 

-< a <- 

X.975 X.025 


(ID 


con 95% de confianza. De manera similar se pueden encontrar otros Intervalos de confianza. Los valores x.025 Y X.975 
representan, respectivamente, los percentiles 2.5 y 97.5. 

En el apéndice IV se encuentran valores percentlles correspondient es a div ersos grados de libertad v. SI se tienen 
valores grandes dev{v> 30), se puede usar el hecho de que (y^x 2 - V2v - 1) se aproxima mucho a una distribución 
normal con media 0 y desviación estándar 1; por lo tanto, las tablas para la distribución normal pueden emplearse 
cuando v > 30. SI X 2 P Y ? p son los percentlles p de la distribución ji cuadrada y de la distribución normal, respectiva¬ 
mente, se tiene 


x ¡ = Y( Zp + V2^ T) 2 (12) 

En este caso hay una gran coincidencia con los resultados obtenidos en los capítulos 8 y 9. 

Para más aplicaciones de la distribución ji cuadrada, ver el capítulo 12. 

GRADOS DE LIBERTAD 

Para calcular un estadístico, por ejemplo (1) y (8), es necesario emplear observaciones obtenidas de una muestra y 
también ciertos parámetros pobl aci onal es. SI estos parámetros no se conocen, es necesario estimarlos a partir de la 
muestra. 
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El número de grados de libertad de un estadístico, que por lo general se denota u, se define como la cantidad N de 
observaciones en la muestra (es decir, el tamaño de la muestra) menos la cantidad k de parámetros poblacionales que 
tengan que estimarse a partir de las observaciones muéstrales. En símbolos, u=N - k. 

En el caso del estadístico (1), la cantidad de observaciones independientes en la muestra es A/, y a partir de el las se 
calculan X y s. Sin embargo, como se necesita estimar /i, k = 1 y por lo tanto v= N - 1. 

En el caso del estadístico (8), la cantidad de observaciones independientes en la muestra es N, a partir de las cuales 
se calcula s. Sin embargo, como se tiene que estimar a, k = 1 y por lo tanto v= N - 1. 


LA DISTRIBUCIÓN F 


Según se ha visto, en algunas aplicaciones es Importante conocer la distribución muestral de la diferencia entre las 
medias^, - X 2 ) de dos muestras. De Igual manera, algunas veces se necesita la distribución muestral de la diferencia 
entre varianzas(sf - S 2 ). Sin embargo, resulta que esta distribución es bastante complicada. Debido a ello, se consi¬ 
dera el estadístico S\/S\, ya que un cociente grande o pequeño Indica una gran diferencia, en tanto que un cociente 
cercano a 1 Indica una diferencia pequeña. En este caso se puede encontrar una distribución muestral a la que se le 
conoce como distribución F en honor a R. A. Flscher. 

M ás precisamente, supóngase que se tienen dos muestras, 1 y 2, de tamaños N 1 y N 2 , respectivamente, obtenidas 
de dos poblaciones normales (o casi normales) cuyas varlanzas son a] y a\. Sea el estadístico 


donde 


F = S\/a\ ^ N x S]/{N x -\)cj\ 
S¡/4 N 2 S 2 /{N 2 -l)oj 

a 2 _ Nrf ~ 2 _ N 2 Sj 
1 Ni — 1 2 N 2 — 1' 


(13) 

(14) 


Entonces a la distribución muestral def se le llama distribución F de Flsher, o simplemente distribución F, con u 1 = 
N 1 ~ 1 Y v 2 = w 2 - 1 grados de libertad. Esta distribución está dada por 

Y ~ (v x F + v 2 ) (v ' +V2)I2 ^ 

donde C es una constante que depende de v 2 y v 2 , de manera que el área total bajo la curva sea 1. Esta curva tiene una 
forma similar a la de las curvas que se muestran en la figura 11-3, aunque esta forma puede variar de manera notable 
de acuerdo con los valores de v x y v 2 . 



Variable 

- F-4-2 

- F-5-10 


Figura 11-3 La línea continua representa la distribución F con 4 y 2 grados de libertad, 
y la línea punteada representa la distribución F con 5 y 10 grados de libertad. 
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En los apéndices V y VI sedan los valores percentlles def para los cuales las áreas en la cola derecha son 0.05 y 
0.01, respectivamente, que se denotan F 95 y F 99 . Estos valores que representan los niveles de significancia del 5% 
y del 1% se usan para determinar si la varianza S? es significativamente mayor que la varianzaS?. En la práctica, como 
muestra 1 se considera la muestra que tenga la mayor varianza. 

El software para estadística permite encontrar las áreas bajo la distribución t de Student, la distribución j¡ cuadrada 
y la distribución F. Este software también permite trazar las distintas distribuciones. Esto se ¡lustrará en la sección de 
problemas resueltos de este capítulo. 


PROBLEMAS RESUELTOS 


DISTRIBUCIÓN tDE STUDENT 



Figura 11-4 Distribución t de Student para 9 grados de libertad. 


11.1 En la figura 11-4 se muestra la gráfica de la distribución tde Student para nueve grados de libertad. Utilizar el 
apéndice III para hallar los valores dea para los que: a) el área a la derecha dea sea 0.05, b) el total del área 
sombreada sea 0.05, c) el total del área que no está sombreada sea 0.99, d) el área sombreada de la Izquierda 
sea 0.01 y e) el área a la izquierda dea sea 0.90. Hallar los Incisos del a) al e) empleando EXCEL. 

SOLUCIÓN 

a) Si el área sombreada a la derecha de a es 0.05, el área a la izquierda de a es (1 - 0.05) = 0.95, y a representa el per- 
centi I 95, 1 95 . E n el apéndice 111, se desciende por la columna cuyo encabezado es v hasta llegar a I a entrada 9, después 
se avanza a la derecha hasta la columna cuyo encabezado es t 95 ; el resultado, 1.83, es el valor de t que se busca. 

b ) Si el total del área sombreada es 0.05, entonces, por simetría, el área sombreada de la derecha es 0.025. Por lo tanto, 
el área a la izquierda dea es (1 - 0.025) = 0.975 y a representa el percentil 97.5, t 975 . En el apéndice III se encuentra 
que 2.26 es el valor de t buscado. 

c) Si el total del área no sombreada es 0.99, entonces el total del área sombreada es (1 - 0.99) = 0.01 y el área sombrea¬ 
da a la derecha dea es 0.01/2 = 0.005. En el apéndice III se encuentra que t 9g5 = 3.25. 

d) Si el área sombreada a la izquierda es 0.01, entonces por simetría el área sombreada a la derecha es 0.01. En el apén¬ 
dice III, t gg = 2.82. Por lo tanto, el valor crítico de t para el cual el área sombreada a la Izquierda es 0.01 es Igual a 
-2.82. 

e) Si el área sombreada a la izquierda dea es 0.90, a corresponde al percentil 90, t go , el cual en el apéndice III se encuen¬ 
tra que es igual a 1.38. 
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Usando EXCEL, con la expresión =TIN V(0.1,9) se obtiene 1.833113. EXCEL requiere la suma de las áreas en las 
dos colas y los grados de libertad. De igual manera, con =TI N V (0.05,9) se obtiene 2.262157, con =TIN V (0.01,9) se obtie¬ 
ne 3.249836, con =TIN V (0.02,9) se obtiene 2.821438 y con =TIN V (0.2,9) se obtiene 1.383029. 

11.2 Encontrar los valores críticos de t para los cuales el área de la cola derecha déla distribución tes 0.05, siendo 

el número de grados de libertad, u, Igual a: a) 16, b) 27 y c) 200. 

SOLUCIÓN 

Usando el apéndice III, en la columna cuyo encabezado es t 95 se encuentran los valores: a) 1.75, correspondiente a v= 16; 
b ) 1.70, correspondiente a v= 27 y c) 1.645, correspondiente au = 200. (El último es el valor que se obtendría usando la 
curva normal; en el apéndice III este valor corresponde a la entrada en el último renglón marcado oo, o infinito.) 

11.3 Los coeficientes de confianza del 95% (dos colas) en la distribución normal son ±1.96. ¿Cuáles son los coefi¬ 
cientes correspondientes en la distribución t para: a) v= 9, b) v= 20, c) v = 30 y d) u= 60? 

SOLUCIÓN 

Para los coeficientes de confianza de 95% (dos colas), el total del área sombreada en la figura 11-4 debe ser 0.05; por lo 
tanto, el área sombreada de la cola derecha debe ser 0.025 y el correspondiente valor de tes t 975 . Entonces, los coeficientes 
de confianza buscados son ±t 975 , que para los valores de v dados son: a) ±2.26, b) ±2.09, c) ±2.04 y d ) ±2.00. 

11.4 En una muestra de 10 mediciones del diámetro de una esfera, la media es X = 438 centímetros (cm) y la des¬ 
viación estándar es s = 0.06 cm. Encontrar los límites de confianza de: a) 95% y b) 99% para el verdadero 

diámetro. 

SOLUCIÓN 

a) Los límites de confianza del 95% están dados por X ± t, 975 (s/VN - 1). 

Como v = N - 1 = 10 - 1 = 9, se encuentra que t 975 = 2.26 [ver también el problema 11.3a)]. Después, usan¬ 
do X = 4.38 y s = 0.06, los límites de confianza buscados de 95% son 4.38 ± 2.26(0.06/\/10 - 1) = 4.38 ± 0.0452 
cm. Por lo tanto, se puede tener una confianza de 95% en que la verdadera media se encuentra entre (438 - 0.045) = 
4.335 cm y (4.38 ± 0.045) = 4.425 cm. 

b) Los límites de confianza del 99% están dados por X ± t. 995 (s/VN - 1). 

Para u= 9, t 995 = 3.25. Entonces, los límites de confianza del 99% son 4.38 ± 3.25(0.06/Vl0 - 1) = 4.38 ± 
0.0650 cm y el intervalo de confianza de 99% es 4.315 a 4.445 cm. 

11.5 De 25 trabajadores seleccionados en forma aleatoria se registró la cantidad de días que el año pasado faltaron 
al trabajo debido al síndrome del túnel carpiano, relacionado con el trabajo. Los resultados se presentan en la 
tabla 11.1. Cuando se usan estos datos para establecer un Intervalo de confianza para la media poblacional de 
todos los casos, relacionados con el trabajo, de síndrome del túnel carpiano, se supone que el número de días 
de ausencia se distribuye normalmente en la población. U sar los datos para probar la suposición de normalidad, 
y si se está dispuesto a asumir la normalidad, entonces dar un Intervalo de 95% para 


Tabla 11.1 


21 

23 

33 

32 

37 

40 

37 

29 

23 

29 

24 

32 

24 

46 

32 

17 

29 

26 

46 

27 

36 

38 

28 

33 

18 
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SOLUCIÓN 

La gráfica de probabilidad normal de M INITAB (figura 11-5) indica que la suposición de la normalidad es razonable, ya 
que el valor p es mayor a 0.15. Este valor p se usa para probar la hipótesis nula de que los datos han sido tomados de una 
población distribuida en forma normal. Empleando el nivel de significancia convencional, 0.05, la normalidad de la distri¬ 
bución de la población se rechazaría sólo si el valor p fuera menor a 0.05. Como se indica que el valor p correspondiente a 
la prueba de Kolmogorov-Smirnov para normalidad es valor p > 0.15, no se rechaza la suposición de normalidad. 

Usando M INITAB, el intervalo de confianza que se encuentra es el siguiente. El intervalo de confianza de 95% para 
la media poblacional va de 27.21 a 33.59 días por año. 

MTB > tinterval 95% confidence f o r data in el 

Intervalos de confianza 

Var i abl e N Mean St Dev SE Mean 95. 0% Cl 

days 2 5 3 0.4 0 7.7 2 1.5 4 ( 2 7.2 1, 3 3.5 9 ) 

11.6 El espesor de las arandelas producidas con una máquina es 0.050 pulgadas (¡n). Para determinar si la máquina 
está trabajando de manera adecuada se toma una muestra de 10 arandelas en las cuales el espesor medio es 
0.053 ¡n y la desviación estándar es 0.003 in. Probar la hipótesis de que la máquina está trabajando en forma 
adecuada usando los niveles de significancia: a) 0.05 y b ) 0.01. 

Gráfica de probabilidad de días 


Normal 



Media 

30.4 

DesvEst 

7.724 

N 

25 

KS 

0.068 

Valor p 

>0.150 


Figura 11-5 Gráfica de probabilidad normal y prueba de normalidad de Kolmogorov-Smirnov. 


SOLUCIÓN 


Se desea decidir entre las dos hipótesis: 

H 0 : /i = 0.050, la máquina está trabajando de manera adecuada. 
n * 0.050, la máquina no está trabajando en forma adecuada. 

Por lo tanto, se requiere una prueba dedos colas. De acuerdo con la hipótesis H 0 se tiene 


t = — — ^Vn- i 

s 


0.053 - 0.050 
01303 


VIO - 1 = 3.00 


a) Para una prueba de dos colas a nivel de significancia 0.05, se adopta la siguiente regla de decisión: 

Aceptar Ho si tse encuentra dentro del intervalo -t 975 a t 975 , el cual para 10 - 1 = 9 grados de libertad es el 
intervalo -2.26 a 2.26. 

Rechazar H 0 si no es así. 

Como t = 3.00, se rechaza H 0 al nivel 0.05. 
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b ) Para una prueba de dos colas al nivel de significancia 0.01, se adopta la siguiente regla de decisión: 

Aceptar H 0 si tse encuentra dentro del intervalo -t 995 a t 995 , el cual para 10 - 1 = 9 grados de libertad es el 
intervalo -3.25 a 3.25. 

Rechazar H 0 si no es así. 

Como t = 3.00, se acepta H 0 al nivel de significancia 0.01. 

Como H o se puede rechazar al nivel de significancia 0.05 pero no al nivel de significancia 0.01, se dice que la mues¬ 
tra da como resultado una probabilidad significativa (ver esta terminología al final del problema 10.5). Por lo tanto, será 
recomendable verificar el funcionamiento de la máquina o, por lo menos, tomar otra muestra. 

11.7 El gerente de un centro comercial realiza una prueba de hipótesis para probar ¡i = $50 contra ¡j, * $50, donde 
/i representa la cantidad media que gasta un comprador en ese centro comercial. En los datos que se presentan 
en la tabla 11.2 se dan las cantidades, en dólares, gastadas por 28 personas en el centro comercial. Para esta 
prueba de hipótesis, usando la distribución t de Student, se supone que los datos empleados para la prueba han 
sido tomados de una población distribuida normalmente. Esta suposición de normalidad puede comprobarse 
usando cualquiera de los métodos para pruebas de normalidad. M INITAB tiene tres posibilidades diferentes 
para pruebas de normalidad. Probar la normalidad al nivel de significancia convencional a = 0.05. SI la supo¬ 
sición de normalidad no se rechaza, entonces se procede a realizar la prueba de hipótesis en que p, = $50 
contra la alternativa ¡i * $50 empleando a = 0.05. 


Tabla 11.2 


68 

49 

45 

76 

65 

50 

54 

92 

24 

36 

60 

66 

57 

74 

52 

75 

36 

40 

62 

56 

94 

57 

64 


72 

65 

59 

45 

33 



SOLUCIÓN 

Empleando la prueba para normalidad deAnderson-Darling de M INITAB se obtiene el valor p = 0.922, la prueba de nor¬ 
malidad de Ryan-Joyner da un valor p mayor a 0.10, y la prueba de normalidad de Kolmogorov-Smirnov da un valor p 
mayor a 0.15. AI nivel de significancia convencional de 5%, en ninguno de los tres casos se puede rechazar la hipótesis de 
que los datos han sido tomados de una población distribuida normalmente. Recuérdese que una hipótesis nula se rechaza 
sólo si el valor p es menor que el nivel de significancia preestablecido. A continuación se presenta el análisis de M INITA B 
para la prueba de la cantidad media gastada por los clientes. Empleando el método clásico para pruebas de hipótesis, la 
hipótesis nula se rechaza si el valor encontrado para el estadístico de prueba es mayor, en valor absoluto, a 2.05. El valor 
crítico, 2.05, se encuentra empleando la distribución t de Student para 27 grados de libertad. Como el valor hallado para el 
estadístico de prueba es 18.50, se rechaza la hipótesis nula y se concluye que la cantidad media gastada por los clientes es 
mayor a $50. Si hace la prueba de hipótesis empleando el método del valor p, entonces como el valor p = 0.0000 es menor 
al nivel de significancia (0.05), también se rechaza la hipótesis nula. 

Despliegue de datos 


Amount 


68 

54 

57 

62 

72 

49 

92 

74 

56 

65 

45 

24 

52 

94 

59 

76 

36 

75 

57 

45 

65 

60 

36 

64 

33 

50 

66 


40 

MTB > TTest 0.0 'Amount' ; 
SUBC > Alternative 0. 
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T-Test of the Mean 

Test of mu =0.00 vs mu not =0.00 

Variable N Mean StDev SE Mean T P 

Amount 2 8 5 8.0 7 1 6.6 1 3.1 4 1 8.5 0 0.0 0 0 0 


11.8 El cociente Intelectual (Cl) de 16 estudiantes de una región de una ciudad resultó con una media de 107 y una 
desviación estándar de 10, el Cl de 14 estudiantes de otra reglón deesa ciudad resultó de 112 y la desviación 
estándar de 8. Al nivel de significancia: a) 0.01 y b) 0.05, ¿hay diferencia entre losCI de estos dos grupos? 

SOLUCIÓN 


Si jUj y n 2 , respectivamente, denotan las medias poblacionales de los Cl de los estudiantes de estas dos reglones, hay que 
decidir entre las hipótesis: 


H 0 : = fj, 2 , en esencia no hay diferencia entre los dos grupos. 

H x : /¿j + /i 2 , hay una diferencia significativa entre los dos grupos. 

De acuerdo con la hipótesis H 0 , 


Por lo tanto, 


t = 


X , -X, 


<t \J 1 /TV] -T 1 / N 2 


donde 


■V | ,sy + N 2 s 2 
2Vi + N 2 - 2 


16(10) 2 + 14(8) 2 
16+14-2 


= 9.44 


t = 


112- 107 


9.44 y/ 1 /16 + 1/14 


= 1.45 


a) Empleando una prueba de dos colas al nivel de significancia 0.01, H 0 se rechaza si t queda fuera del intervalo -t gg5 a 

t gg5 , el cual para {N 1 + N 2 -2) = (16 + 14 - 2) = 28 grados de libertad es el intervalo -2.76 a 2.76. Por lo tanto, al 

nivel de significancia 0.01 no se puede rechazar H 0 . 

b ) Empleando una prueba de dos colas al nivel de significancia 0.05, H 0 se rechaza si t queda fuera del intervalo -t 975 a 

t g75 , el cual para 28 grados de libertad es el intervalo -2.05 a 2.05. Por lo tanto, al nivel de significancia 0.05 no se 

puede rechazar H 0 . 

Se concluye que no hay una diferencia significativa entre los Cl de los dos grupos. 


11.9 En la tabla 11.3 se dan los costos anuales (en miles de dólares) de colegiatura, alojamiento y manutención en 
10 universidades privadas elegidas en forma aleatoria y 15 universidades públicas elegidas en forma aleatoria. 
Probar la hipótesis nula de que el costo medio anual en las universidades privadas es 10 mil dólares mayor al 
costo medio anual en las universidades públicas, contra la hipótesis alternativa deque la diferencia no es de 10 
mil dólares. Usar el nivel de significancia 0.05. Antes de realizar la prueba de las medias, probar, al nivel de 
significancia 0.05, la suposición de normalidad y de varlanzas ¡guales. 


Tabla 11.3 


Universidades públicas 

U niversidades privadas 

4.2 

9.1 

11.6 

13.0 

17.7 

6.1 

7.7 

10.4 

18.8 

17.6 

4.9 

6.5 

5.0 

13.2 

19.8 

8.5 

6.2 

10.4 

14.4 

16.8 

4.6 

10.2 

8.1 

17.7 

16.1 


SOLUCIÓN 

En la figura 11-6 se muestran los resultados de M INITAB para la prueba de normalidad de A nderson-DarlIng de las uni¬ 
versidades públicas. Dado que el valor p (0.432) no es menor a 0.05, la suposición de normalidad no se rechaza. U na 
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prueba similar para las universidades privadas indica que la suposición de normalidad también es válida para las universi¬ 
dades privadas. 


Gráfica de probabilidad de las públicas 


Normal 



Media 

7.567 

DesvEst 

2.417 

N 

15 

AD 

0.346 

Valor p 

0.432 


Prueba devarianzas iguales para públicas* privadas 
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0.21 
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0.651 


1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 

Intervalos de confianza de 95% deBonferroni para desviaciones estándar 


Públicas 


Privadas 



7.5 10.0 12.5 15.0 17.5 20.0 

Datos 

Figura 11-6 Prueba de normalidad deAnderson-Darlingy prueba F devarianzas iguales. 


La prueba F que se muestra en la parte Inferior de la figura 11-6 indica que puede suponerse que las varianzas son 
iguales. Con la secuencia de comandos "Stat => Basic Statistics => 2-samplet" se obtiene el resultado que se da a conti¬ 
nuación. Los resultados indican que no se puede rechazar que el costo de las universidades privadas sea 10 mil dólares 
mayor al de las universidades públicas. 
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DISTRIBUCIÓN jl CUADRADA 



Figura 11-7 Distribución ji cuadrada para 5 grados de libertad. 


11.10 En la figura 11-7 se muestra la gráfica de la distribución ji cuadrada para 5 grados de libertad. Empleando 
el apéndice IV, hallar los valores críticos de x 2 para los cuales: a) el área sombreada de la derecha es 0.05, 

b) el total del área sombreada es 0.05, c) el área sombreada de la Izquierda es 0.10 y d) el área sombreada de 
la derecha es 0.01. Hallar también estas respuestas usando EXCEL. 

SOLUCIÓN 

a) Si el área sombreada de la derecha es 0.05, entonces el área a la izquierda de b es (1 - 0.05) = 0.95 y b es el percen- 

til 95, x 2 9 ¡- Refiérase al apéndice IV, bajar por la columna que tiene como encabezado v hasta llegar a la entrada 5, y 

después avanzar hacia la derecha hasta la columna cuyo encabezado es xüs: el resultado, 11 . 1 , es el valor crítico de 
X 2 que se busca. 

b) Como esta distribución no es simétrica, hay muchos valores críticos para los que el total del área sombreada es 0.05. 
Por ejemplo, el área sombreada de la derecha puede ser 0.04 y el área sombreada de la izquierda 0.01. Sin embargo, 
se acostumbra, a menos que se especifique otra cosa, elegir estas áreas de manera que sean iguales. En este caso, 
entonces, cada área es 0.025. Si el área sombreada de la derecha es 0.025, el área a la izquierda de b es 1 - 0.025 = 
0.975 y ó es el percentil 97.5, x 2 975 . el cual de acuerdo con el apéndice IV es 12.8. De igual manera, si el área som¬ 
breada de la izquierda es 0.025, el área a la izquierda dea es 0.025 y a es el percentil 2.5, x 2 025 . que es igual a 0.831. 
Por lo tanto, los valores críticos son 0.83 y 12.8. 

c) Si el área sombreada de la Izquierda es 0.10, a representa el percentil 10, x 2 o< e l cual es igual a 1.61. 

d ) Si el área sombreada de la derecha es 0.01, el área a la izquierda de b es 0.99 y b representa el percentil 99, XÍ 99 . el 

cual es igual a 15.1. 

La respuesta de EXCEL para a) se obtiene con =CHIINV(0.05,5), que da 11.0705. El primer parámetro de CHIIN V es el 
área a la derecha del punto y el segundo es el número de grados de libertad. La respuesta para b ) se obtiene con 
=C H11N V (0.975,5), que da 0.8312 y =C H11N V (0.025,5) da 12.8325. La respuesta para c) se obtiene con =C H11N V (0.9,5), 
queda 1.6103. La respuesta parad) se obtiene con =C H11N V (0.01,5), queda 15.0863. 

11.11 Encontrar el valor crítico de x 2 tal que el área en la cola derecha déla distribución x 2 sea 0.05, siendo el núme¬ 
ro de grados de libertad, v, Igual a: a) 15, b) 21 y c) 50. 

SOLUCIÓN 

En el apéndice IV, en la columna cuyo encabezado es x 2 95 se encuentran los valores: a) 25.0 que corresponde a v = 15; b ) 
32.7 que corresponde a v = 21 y c) 67.5 que corresponde a v = 50. 
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11.12 Encontrar el valor mediano de % 2 que corresponda a: a) 9, b) 28 y c) 40 grados de libertad. 

SOLUCIÓN 

En el apéndice IV, en la columna cuyo encabezado esxíso (ya que la mediana es el percentil 50), se encuentran los valores: 
a) 8.34, que corresponde a v = 9; b ) 27.3, que corresponde a v = 28, y c) 39.3, que corresponde a v = 40. 

Resulta interesante observar que los valores medianos están muy cercanos a la Igualdad del número de grados de 
libertad. De hecho, para v > 10, los valores medianos son ¡guales a [u - 0.7), como puede verse en la tabla. 

11.13 La desviación estándar de las estaturas de 16 estudiantes elegidos en forma aleatoria en una escuela de 1 000 
estudiantes es 2.40 ¡n. Encontrar los límites de confianza de: a) 95% y b) 99% para la desviación estándar de 
las estaturas de todos los estudiantes de esta escuela. 

SOLUCIÓN 

a) Los límites de confianza de 95% son sy/Ñ/xsisY sVÑ/xms- 

Para^= 16 - 1 = 15 grados de libertad, x Z 975 = 27.5 (o bienx .975 = 5.24) y x 2 025 = 6.26 (o bien x .025 = 2.50). 
Los límites de confianza de 95% son 2.40-/I6/5.24 y 2.40\/l6/2.50 (es decir, 1.83 y 3.84 in). Por lo tanto, se puede 
tener una confianza de 95% de que la desviación estándar poblacional se encuentra entre 1.83 y 3.84 in. 

b) Los límites de confianza de 99% son sVÑ/x .995 y s/a/tv/x.oos- 

Para v = 16 - 1 = 15 grados de libertad están dados por x 2 995 = 32.8 (o x .995 = 5.73) y x 2 oos = 4.60 (o bien 
X 005 = 2.14). Entonces los límites de confianza de 99% son 2.40\/l6/5.73y 2.40\/l6/2.14 (es decir, 1.68 y 4.49 in). 
Por lo tanto, se puede tener una confianza de 99% de que la desviación estándar poblacional se encuentre entre 1.68 
y 4.49 in. 

11.14 Encontrar x 2 95 para: a) v= 50 y b) v= 100 grados de libertad. 

SOLUCIÓN 

Para v mayor que 30 se puede emplear el hecho de que V^X 2 - V2v - 1 es una distribución aproximadamente normal en 
la que la media es 0 y la desviación estándar es 1 . Entonces, si z p es un percentil de la puntuación zen la distribución normal 
estándar, se puede escribir, con un alto grado de aproximación, 

Y ^X 2 p - V 2 V- 1 =z p O yjlxj, = Z P + V2u- 1 

de donde x^ = 5 (z p + Vlv- l) 2 . 

a) Si v = 50, x 2 95 = ¿(z .95 + x/2(50) - l ) 2 = i(1.64 + \/99 ) 2 = 67.2, lo que coincide muy bien con el valor 67.5 dado 
en el apéndice IV. 

b ) Si v = 100, XÍ 95 = H z .9 5 + \/2(100) - l) 2 = |(1.64+ Vl99) 2 = 124.0 (verdadero valor = 124.3). 

11.15 La desviación estándar del tiempo de vida de una muestra de 200 bom bilí as eléctricas es 100 horas (h). Encontrar 
los límites de confianza de: a) 95% y b) 99% para la desviación estándar de estas bombillas eléctricas. 

SOLUCIÓN 

a) Los límites de confianza de 95% están dados por sVÑ/x.gysY sy/Ñ/xms- 

Para u = 200 - 1 = 199 grados de libertad, se encuentra (como en el problema 11.14) 

X 2 975 =K z -975 + V2(199)-l) 2 = 4(1.96+ 19.92) 2 = 239 
X 2 025 =i ("025 + x/2(199) - l ) 2 = 1 (-1.96+ 19.92) 2 = 161 

por lo tanto, x .975 = 15.5 y xo .025 = 12.7. De manera que los límites de confianza del 95% son 100V200/15.5 = 
91.2 hy 100^200/12.7 = 111.3 h, respectivamente. Se puede tener una confianza de 95% en que la desviación están¬ 
dar poblacional esté entre 91.2 y 111.3 h. 
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b) Los límites de confianza de 99% están dados por sVÑ/x. 995 y sVÑ/x. oos- 
Para u = 200 - 1 = 199 grados de libertad, 

X 2 995 = H z -995 + \/ 2(199) — l) 2 = i (2.58 + 19.92) 2 = 253 

Xíbos = k (*oos + y/2(199) — l) 2 = i (-2.58 + 19.92) 2 = 150 

por lo tanto, x.995 = 15.9 y x.005 = 12 ' 2 - De manera que los límites de confianza del 99% son 100v / 200/15.9 = 
88.9 h y 100\/500/12.2 = 115.9 h, respectivamente. Se puede tener una confianza de 99% en que la desviación están¬ 
dar poblacional esté entre 88.9 y 115.9 h. 

11.16 U n fabricante de ejes requiere que en el proceso de fabricación el diámetro de los ejes sea 5.000 cm. Además, 
para garantizar que las ruedas se ajusten de manera adecuada a los ejes, es necesario que la desviación estándar 
en los diámetros sea 0.005 cm o menos. En la tabla 11.4 se presentan los diámetros de los 20 ejes de una 
muestra. 


Tabla 11.4 


4.996 

4.998 

5.002 

4.999 

5.010 

4.997 

5.003 

4.998 

5.006 

5.004 

5.000 

4.993 

5.002 

4.996 

5.005 

4.992 

5.007 

5.003 

5.000 

5.000 


El fabricante desea probar la hipótesis nula de que la desviación estándar poblacional es 0.005 cm contra 
la hipótesis alternativa de que la desviación estándar poblacional es mayor a 0.005 cm. Si se confirma la hipó¬ 
tesis alternativa, entonces el proceso defabricación debe detenerse y deben hacerse ajustesa las máquinas. Para 
la prueba se supone que los diámetros de los ejes tienen una distribución normal. Probar esta suposición al nivel 
de significancia 0.05. SI se está dispuesto a suponer normalidad, entonces hacer la prueba concerniente a 
la desviación estándar poblacional al nivel de significancia 0.05. 

SOLUCIÓN 

En la figura 11-8 se muestra la prueba de normalidad de Shaplro-W11k. Como el valor p que se obtiene es grande (0.9966), 
no se puede rechazar la normalidad. Esta gráfica de probabilidad y el análisis de Shaplro-Wilk se hicieron empleando el 
paquete STATISTIX de software para estadística. 

Se tiene que decidir entre las hipótesis: 

H 0 : a = 0.005 cm, el valor observado se debe a la casualidad. 

Hj: a = 0.005 cm, la variabilidad es demasiado grande. 

El análisis realizado con SAS es el siguiente: 

One Sample Chi-square Test for a Vari anee 
Sampl e St at i st i es for di a me t e r 

N Mea n St d. Dev. Va r i a nc e 

2 0 5.0 0 0 6 0.0 0 4 6 2 1 5 E - 7 

Hypothesis Test 

Nuil hypothesis: Vari anee of diameter <=0.000025 
Al ternati ve: Vari anee of diameter > 0.000025 
Chi-square Df Prob 

16.358 19 0.6333 

Como el valor p obtenido (0.6333) es grande, esto indica que la hipótesis nula no se debe rechazar. 
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Gráfica del diámetro de probabilidad normal 


5.011 


5.006 - 


5.001 - 



4.996 - 


4.991 

—i- 

-1 0 1 

Grados de clasificación 

20 casos de Shapiro-Wilk W 0.9890 P(W) 0.9966 

Figura 11-8 STATISTIX, prueba denormalidad de Shapiro-Wilk. 


11.17 L a desviación estándar en los pesos de paquetes de 40.0 onzas (oz), llenados con una máquina, ha sido 0.25 oz. 
En una muestra de 20 paquetes se observa una desviación estándar de 0.32 oz. ¿Este aparente incremento en la 
variabilidad es significativo a los niveles: a) 0.05 y b) 0.01? 

SOLUCIÓN 

Decidir entre las hipótesis: 

H 0 : a = 0.25 oz, el resultado observado es casual idad. 

H 1 : a > 0.25 oz, la variabilidad ha aumentado. 

El valor de x 2 para la muestra es 


^ 20 ( 032 )^ 
o 2 (0.25) 2 

a) Empleando una prueba de una cola, al nivel de significancia 0.05, se rechaza H 0 si los valores muéstrales de x 2 son 
mayores a x 2 95 , lo que es igual a 30.1 para v = 20 - 1 = 19 grados de libertad. Por lo tanto, se rechaza H 0 al nivel de 
significancia 0.05. 

b ) Empleando una prueba de una cola, al nivel de significancia 0.01, se puede rechazar H 0 si los valores muéstrales de 
X 2 son mayores a x Z 99 , lo que es igual a 36.2 para 19 grados de libertad. Por lo tanto, al nivel de significancia 0.01, no 
se rechaza H 0 . 

Se concluye que la variabilidad probablemente ha aumentado. Se recomienda examinar la máquina. 

LA DISTRIBUCIÓN F 

11.18 De poblaciones distribuidas en forma normal se obtienen dos muestras de tamaños 9 y 12 cuyas varianzas son 
16 y 25. Si las varianzas muéstrales son 20 y 8, respectivamente, determinar si la primera muestra tiene una 
varianza bastante mayor que la segunda muestra al nivel de significancia: a) 0.05, b) 0.01 y c) usar EXCEL 
para mostrar que el área a la derecha de 4.03 está entre 0.01 y 0.05. 
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SOLUCIÓN 

Para estas dos muestras, 1 y 2, se tiene TV, =9, N 2 = 12, a\ = 16, a\ = 25, Sj = 20 y S 2 = 8. Por lo tanto, 

S\/o\ N x S]/{N x -\)a] (9)(20)/(9 — 1) (16) 

Sj/oí N 2 Sj/(N 2 -l)aj (12) (8)/(12 — 1) (25) ' 

a) Los grados de libertad para el numerador y para el denominador deF sonz> 1 = A/ 1 l = 91 = 8yi^ 2 = w 2 l = 
12 - 1 = 11. Entonces, en el apéndice V se encuentra queF 95 = 2.95. Como el valor deF calculado es F = 4.03, que 
es mayor a 2.95, se concluye que la varianza de la muestra 1 es significativamente mayor que la de la muestra 2, al 
nivel de significancia 0.05. 

b) Para = 8 y v 2 = 11, en el apéndice VI se encuentra F 01 = 4.74. En este caso el valor de F calculado es F = 4.03, 
que es menor a 4.74. Por lo tanto, no se puede concluir que la varianza de la muestra 1 sea mayor que la varianza de 
la muestra 2, al nivel de significancia 0.01. 

c) El área a la derecha de4.03 está dada por =FDIST(4.03,8,11) y es 0.018. 

11.19 De dos poblaciones distribuidas de manera normal se toman dos muestras, una de tamaño 8 y otra de tamaño 

10, cuyas varianzas corresponden a 20 y 36. Encontrar la probabilidad de que la varianza de la primera mues¬ 
tra sea mayor al doble de la varianza de la segunda muestra. 

Usar EXCEL para hallar la probabilidad exacta de queF con 7 y 9 grados de libertad sea mayor a 3.70. 

SOLUCIÓN 


Se tiene N¡ = 8, N 2 = 10, a 2 , = 20, y <j\ = 36. Por lo tanto, 


8Sf/(7)(20) _ S? 

10Sf/(9)(36) ' S\ 

El número de grados de libertad en el numerador y en el denominador esí/ 1 = A/ 1 -l = 8- l = 7yz/ 2 = N 2 -l = 10- 
1 = 9. A hora, si Sj es mayor al doble de S 2 , entonces 

O 2 

F = 1.85— i- > (1.85)(2) = 3.70 
S 2 

Buscando 3.70 en los apéndices V y VI se encuentra que la probabilidad es menor a 0.05 pero mayor a 0.01. Para encontrar 
los valores exactos se necesita una tabulación más extensa que la distribución F. 

ConEXCELIa respuesta se obtiene con =FDIST(3.7,7,9), que da 0.036, que es la probabilidad de queF con 7 y 9 
grados de libertad sea mayor a 3.70. 


PROBLEMAS SUPLEM ENTARIOS 


DISTRIBUCIÓN tDE STUDENT 

11.20 En una distribución de Student con 15 grados de libertad, encontrar el valor de t x tal que: a) el área a la derecha de ty sea 
0.01, b ) el área a la Izquierda de t x sea 0.95, c) el área a la derecha de t x sea 0.10, d) el área a la derecha de íj junto con el 
área a la Izquierda de -fy sea 0.01 y e) el área entre -t x y t x sea 0.95. 

11.21 Usando el apéndice III, encontrar los valores críticos de t para los cuales el área en la cola derecha de la distribución t sea 
0.01, siendo el número de grados de libertad, v, igual a: a) 4, b ) 12, c) 25, d) 60 y e) 150. Dar las soluciones de a) a e) 
usando EXCEL. 
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11.22 En la distribución t de Student encontrar los valores de que satisfacen cada una de las condiciones siguientes: 

a) El área entre —y fj es 0.90 y u= 25. 

b ) El área a la izquierda de ~t x es 0.025 y v = 20. 

c) EI área a la derecha de tj junto con el área a la izquierda de -t x es 0.01 y v = 5. 

d) EI área a la derecha de t : es 0.55 y v = 16. 

11.23 Si una variable U tiene una distribución t de Student con v= 10, encontrar la constanteC que satisfaga: a) Pr {U > C} = 
0.05, b) Pr{—C <U <C} = 0.98, c) Pr{(7 < C} = 0.20 y d) Pr{U > C} = 0.90. 


11.24 En la distribución normal, los coeficientes de confianza de 99% (dos colas) son ± 2.58. ¿Cuáles son los coeficientes corres¬ 
pondientes en la distribución tsi: a) v = 4, b) v = 12, c) v= 25, d) v = 30, y e) v = 40? 


11.25 En una muestra de 12 mediciones de la resistencia a la ruptura de un hilo de algodón, la media es 7.38 gramos (g) y la 
desviación estándar 1.24 g. Encontrar los límites de confianza de: a) 95% y b) 99% para la verdadera resistencia a la rup¬ 
tura y c) la solución que da M INITAB usando el resumen de estadísticos. 

11.26 Resolver el ejercicio 11.25 suponiendo que los métodos de la teoría de muestras grandes son aplicables, y comparar los 
resultados obtenidos. 


11.27 Se tomaron cinco mediciones del tiempo de reacción de una persona a cierto estímulo: las mediciones fueron 0.28, 0.30, 
0.27, 0.33 y 0.31 segundos. Encontrar los límites de confianza de: a) 95% y b ) 99% para el verdadero tiempo de reac¬ 
ción. 


11.28 El tiempo medio de vida de los focos eléctricos producidos por una empresa ha sido 1120 h y la desviación estándar 125 
h. En una muestra de 8 focos eléctricos, recientemente producidos, el tiempo medio de vida fue de 1 070 h. Probar la hipó¬ 
tesis de que el tiempo medio de vida de los focos no ha variado, usando los niveles de significancia: a) 0.05 y b) 0.01. 


11.29 En el problema 11.28 probar las hipótesis ¿t = 1120 h contra ¿í < 1120 h, usando como niveles de significancia: a) 0.05 
y ó) 0.01. 

11.30 Las especificaciones en la producción de cierta aleación exigen 23.2% de cobre. En una muestra consistente en 10 análisis 
del producto, el contenido medio de cobre fue 23.5% y la desviación estándar 0.24%. A los niveles de significancia: a) 0.05 
y b ) 0.01 ¿puede concluirse que el producto satisface las especificaciones? 

11.31 En el problema 11.30, empleando los niveles de significancia: a) 0.01 y b) 0.05, probar la hipótesis de que el contenido 
medio de cobre es mayor que el requerido por las especificaciones. 

11.32 U n experto asegura que introduciendo un nuevo tipo de máquina en un proceso de producción se puede disminuir notable¬ 
mente el tiempo de producción. Debido a los gastos requeridos para el mantenimiento de esta máquina, el gerente encuen¬ 
tra que a menos que el tiempo de producción se reduzca por lo menos en 8%, no vale la pena introducir la nueva máquina. 
Seis experimentos resultantes mostraron que el tiempo de producción se redujo en 8.4% con una desviación estándar de 
0.32%. Usando como niveles de significancia: a) 0.01 y b) 0.05, probar la hipótesis de que debe introducirse la nueva 
máquina. 


11.33 Empleando una marca A de gasolina el rendimiento medio en millas por galón encontrado en cinco automóviles similares 
bajo condiciones idénticas es 22.6 y la desviación estándar es 0.48. Empleando la marca 6, el rendimiento medio es 21.4 y 
la desviación estándar es 0.54. Usando el nivel de significancia 0.05, investigar si la marca A da real mente un mejor rendi¬ 
miento que la marca 6. 
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11.34 Se prueba el pH (grado de acidez de una solución) dedos soluciones químicas, /4 y 6. En seis muestras de A la media en el 
pH es 7.2 y la desviación estándar es 0.024. En cinco muestras de la solución B la media en el pH es 7.49 y la desviación 
estándar es 0.032. AI nivel de significancia 0.05, determinar si el pH de estos dos tipos de soluciones es diferente. 


11.35 En un examen de psicología, la media de las calificaciones de los 12 estudiantes de un grupo es 78 y la desviación estándar 
es 6; la media de las calificaciones de los 15 estudiantes de otro grupo es 74 y la desviación estándar es 8. Empleando el 
nivel de significancia 0.05, determinar si el primer grupo es mejor que el segundo grupo. 


LADISTRIBUCIÓN JI CUADRADA 

11.36 En el apéndice IV, en la distribución ji cuadrada para 12 grados de libertad, hallar el valor de xí tal que: a) el área a la 
derecha de xi sea 0.05, b ) el área a la izquierda de xi sea 0.99, c) el área a la derecha de xí sea 0.025 y d) resolver los 
incisos del a) al c) empleando EXCEL. 

11.37 H aliar los valores críticos de x 2 para los cuales el área en la cola derecha de la distribución es 0.05, siendo el número de 
grados de libertad, v, igual a: a) 8, b ) 19, c) 29 y d) 40. 


11.38 Resolver el problema 11.37 si el área en la cola derecha es 0.01. 

11.39 a) Encontrar xí y xi tales que el área bajo la distribución x 2 para v = 20 entre x? y xl sea 0.95, suponiendo áreas igua¬ 

les a la derecha de xl y a la izquierda de xi- 

b ) M ostrar que si en a) no se hace la suposición de áreas iguales, los valores xí y xi no son únicos. 

11.40 Si una variable U tiene la distribución ji cuadrada con v = 1 , encontrar xí y xi tales que: a) Pr{í7 > xl} = 0.025, 

b) Pr {U < xí} = 0.50 y c) Pr{ X ? < U < xl} = 0.90. 


11.41 La desviación estándar encontrada en la duración de 10 bombillas eléctricas producidas por una empresa es 120 h. Encontrar 
los límites de confianza de: a) 95% y b) 99% para la desviación estándar de todas las bombillas eléctricas fabricadas por la 
empresa. 


11.42 Resolver el problema 11.41 si se tienen 25 bombillas eléctricas en las que la desviación estándar es 120 h. 


11.43 Encontrar: a) xmY b) xls para v= 150 empleando x¡, = \( Z P + V2v- l) 2 y c) comparar estos resultados con los que se 
obtienen usando EXCEL. 


11.44 Encontrar: a) xl^y ó) x 2 97 s para v = 250 empleando xl = H Z P + V2v- l) 2 y c) comparar estos resultados con los que 
se obtienen usando EXCEL. 


11.45 Mostrar que si se tienen valores grandes de v, una buena aproximación a x 2 es la dada por (v + z p V2u), donde z p es el 
percentil p de la distribución normal estándar. 


11.46 Resolver el problema 11.39 usando la distribución x 2 si en una muestra de 100 bombillas eléctricas se encuentra la misma 
desviación estándar de 120 h. Comparar los resultados con los obtenidos con los métodos del capítulo 9. 


11.47 En el problema 11.44, ¿cuál es el intervalo de confianza de 95% que tiene la menor amplitud? 
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11.48 La desviación estándar en la resistencia a la ruptura de determinados cables producidos por una empresa es de 240 libras 
(Ib). Después de que se Introdujo una modificación en el proceso de fabricación de estos cables, en una muestra de ocho 
cables la desviación estándar encontrada fue 300 Ib. Investigar la significancia del aparente aumento de variabilidad a los 
niveles de significancia: a) 0.05 y b) 0.01. 

11.49 La desviación estándar de la temperatura anual de una ciudad durante 100 años fue de 16° Fahrenheit. Usando la tempera¬ 
tura media del día 15 de cada mes durante los últimos 15 años, la desviación estándar calculada de la temperatura anual fue 
de 10° Fahrenheit. Probar la hipótesis de que la temperatura en la ciudad se volvió menos variable que en el pasado, usan¬ 
do los niveles de significancia de: a) 0.05 y b) 0.01. 


LA DISTRIBUCIÓN F 

11.50 Empleando los apéndices V y VI, encontrar los valores deF que se piden en los Incisos del a) al d). 

a) F 0 95 para \/ l = 8 y l/ 2 = 10. 

b) F o 9g para V 1 = 24yV 2 = ll. 

c) F 0 85 paraA/j = 16 y A/ 2 = 25. 

d ) F 0 90 paraA/j = 21 y A/ 2 = 23. 

11.51 Resolver el problema 11.50 usando EXCEL. 

11.52 De poblaciones distribuidas normalmente cuyas varianzas son 40 y 60 se toman dos muestras de tamaños 10 y 15, respec¬ 
tivamente. SI las varianzas muéstrales son 90 y 50, determinar si la varianza de la muestra 1 es significativamente mayor 
que la de la muestra 2 a los niveles de: a) 0.05 y b) 0.01. 

11.53 Dos empresas, A y 6, fabrican bombillas eléctricas. Los tiempos de vida de estas bombillas están distribuidos casi en forma 
normal y sus desviaciones estándar son 20 y 27 h, respectivamente. Si se toman 16 bombillas de la empresas y 20 bombi¬ 
llas de la empresas y se determina que las desviaciones estándar desús tiempos de vida corresponden a 15 y 40 h, ¿puede 
determinarse, a los niveles de significancia: a) 0.05 y b ) 0.01, que la variabilidad en las bombillas de4 es mayor que la 
variabilidad en las bombillas deS? 


12 


La prueba 

JI CUADRADA 


FRECUENCIAS OBSERVADAS Y FRECUENCIAS TEÓRICAS 

Como se ha visto, los resultados obtenidos de las muestras no siempre coinciden exactamente con los resultados teó¬ 
ricos esperados según las reglas de la probabilidad. Por ejemplo, aunque de acuerdo con las consideraciones teóricas 
en 100 lanzamientos de una moneda se esperarían 50 caras y 50 cruces, es raro que se obtengan exactamente estos 
resultados. 

Supóngase que en una muestra determinada se observa la ocurrencia de un conjunto de eventos E v E 2 , £ 3 . E k 

(ver tabla 12.1) con las frecuencias o 1; o 2 , o 3 ,..., o k , llamadas frecuencias observadas y que, según las reglas de la 
probabilidad, se esperaría que estos eventos ocurrieran con frecuencias e 3 , e 2 , e 3 ,...,e k , llamadas frecuencias espera¬ 
das o teóricas. Se desea saber si las frecuencias observadas difieren, de manera significativa, de las frecuencias espe¬ 
radas. 


Tabla 12.1 


Eventos 


e 2 

Es 


E k 

Frecuencias observadas 

°i 

°2 

°3 


Ok 

Frecuencias esperadas 

ai 

e 2 

e 3 




DEFINICIÓN DE X 2 


U na medida de la discrepancia entre las frecuencias observadas y las frecuencias esperadas la proporciona el estadís¬ 
tico x 2 (léase ji cuadrada) dado por 


2 (oi~e,) (o 2 -e 2 ) 

X = -1- 

e¡ ^2 

Donde, si la frecuencia total es N, 


i°k ~ e k) _ ^ (°j ~ e j) 


ek 


7=1 


( 1 ) 


E °j = E e¡ = N 

Una expresión equivalente a la fórmula (1) es (ver problema 12.11) 


( 2 ) 


x' 


' 2 = E -~N 


(3) 


Si x 2 = 0. las frecuencias observadas y las frecuencias teóricas coinciden exactamente; en tanto que si x 2 > 0. la 
coincidencia no es exacta. Cuanto mayor sea el valor de x 2 . mayor la discrepancia entre frecuencias observadas y 
frecuencias esperadas. 
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La distribución muestral dex 2 se puede aproximar con bastante exactitud mediante la distribución ji cuadrada 

Y = FoCyY^-V 172 * 2 = Y,X v - 2 e- l ' 2xl (4) 

(vista en el capítulo 11) si las frecuencias esperadas son mayores o iguales a 5. La aproximación mejora cuanto mayo¬ 
res sean estos valores. 

El número de grados de libertad, v, es 

1. v= k - 1 si las frecuencias esperadas pueden calcularse sin tener que estimar parámetros poblad onal es a partir de 
estadísticos muéstrales. Obsérvese que a kse le resta 1 debido a la condición restrictiva (2), que establece que cono¬ 
ciendo k-láe las frecuencias esperadas, queda determinada la frecuencia restante. 

2. v = k-l-ms\ las frecuencias esperadas sólo pueden calcularse estimando m parámetros poblacionales a partir 
de estadísticos muéstrales. 

PRUEBAS DE SIGNIFICANCIA 

En la práctica, las frecuencias esperadas se calculan basándose en la hipótesis H 0 . Si de acuerdo con esta hipótesis el 
valor calculado para x 2 , mediante las ecuaciones (1) o ( 3) es mayor a algún valor crítico (por ejemplo, x 2 95 o x 2 99 - que 
son los valores críticos para los niveles de significancia 0.05 y 0.01, respectivamente), se concluye que las frecuencias 
observadas difieren en forma significativa de las frecuencias esperadas y se rechaza H 0 al correspondiente nivel de 
significancia; si no es así, se acepta H 0 (o por lo menos no se rechaza). A este procedimiento se le conoce como prue¬ 
ba ¡i cuadrada de hipótesis o de significancia. 

Es necesario notar que hay que tener desconfianza de aquellas circunstancias en las que x 2 tenga un valor dema¬ 
siado cercano a cero, pues es raro que exista una coincidencia tan buena entre las frecuencias observadas y las fre¬ 
cuencias esperadas. Para examinar tales situaciones se determina si el valor obtenido para x 2 es menor a x 2 os o a x 2 oi- 
en cuyo caso se decide que a los niveles de significancia 0.05 o 0.01, respectivamente, la coincidencia es demasiado 
buena. 

LA PRUEBA JI CUADRADA DE BONDAD DE AJUSTE 

La prueba chi cuadrada puede emplearse para determinar qué tan bien se ajustan una distribución teórica (por ejemplo, 
la distribución normal o la distribución binomial) a una distribución empírica (es decir, a una distribución obtenida a 
partir de datos muéstrales). Ver los problemas 12.12 y 12.13. 

EJEMPLO 1 U n par de dados se lanzan 500 veces y las sumas de las caras que caen hacia arriba son las que se muestran en la 
tabla 12.2. 


Tabla 12.2 


Suma 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

Observada 

15 

35 

49 

58 

65 

76 

72 

60 

35 

29 

6 


Los números esperados, si el dado no está cargado, se determinan a partir de la distribución dex y son los que se muestran 
en la tabla 12.3. 


Tabla 12.3 


X 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

p(x) 

1/36 

2/36 

3/36 

4/36 

5/36 

6/36 

5/36 

4/36 

3/36 

2/36 

1/36 


En la tabla 12.4 se presentan las frecuencias observadas y las frecuencias esperadas. 

Tabla 12.4 


Observada 

15 

35 

49 

58 

65 

76 

72 

60 

35 

29 

6 

Esperada 

13.9 

27.8 

41.7 

55.6 

69.5 

83.4 

69.5 

55.6 

41.7 

27.8 

13.9 
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Si en las celdas B1:L2 de una hoja de cálculo de EXCEL se introducen las frecuencias observadas y las frecuencias 
esperadas, en la celda B4 se introduce la expresión =(Bl-B2) / '2/B2, se hace clic y se arrastra desde B 4 hasta L4 y las cantida¬ 
des en B 4:L4 se suman, se obtiene 10.34 como el valor de \ ((°j - e j) 2 / e j)- 

El valor p que corresponde a 10.34 se obtiene mediante la expresión de EX CEL =CHIDIST(10.34,10). Este valor p es 
0.411 y dado que es grande, no hay razón para pensar que el dado esté cargado. 


TABLAS DE CONTINGENCIA 

A tablas como la 12.1 en las que las frecuencias observadas ocupan un solo renglón se les I lama tablas de clasificación 
en un solo sentido. Como el número de columnas es k, se les llama también tablas 1 x k (que se lee "1 por k"). Por 
extensión de estas ¡deas, se obtienen tablas de clasificación en dos sentidos, o tablas h x /c, en las que las frecuencias 
observadas ocupan h renglones y k columnas. A estas tablas se les suele llamar tablas de contingencia. 

En una tabla de contingencia h x k, para cada frecuencia observada hay una frecuencia esperada (o teórica ), que 
se calcula basándose en alguna hipótesis y sujetándose a las reglas de probabilidad. A las frecuencias que ocupan las 
celdas de una tabla de contingencia se les llama frecuencias de celda. Al total de las frecuencias de un renglón o de 
una columna se le llama frecuencia marginal. 

Para investigar el grado de coincidencia entre las frecuencias observadas y las frecuencias esperadas se calcula el 
estadístico 


2 


X 



(5) 


donde la suma se realiza sobre todas las celdas de la tabla de contingencia y donde los símbolos o¡ y e¡ representan 
frecuencias, observada y esperada, en la celda y. Esta suma, que es análoga a la de la ecuación (1), conti ene hk términos. 
La suma de todas las frecuencias observadas, que se denota N, es Igual a la suma de todas las frecuencias esperadas 
[ver la ecuación (2)]. 

Como antes, el estadístico (5) tiene una distribución muestral que está dada, con una aproximación muy buena, por 
(4), siempre y cuando las frecuencias esperadas no sean demasiado pequeñas. El número de grados de libertad, v, de 
esta distribución j¡ cuadrada es, para h > 1 y k > 1, 


1. u={h - l)(/c - 1) si las frecuencias esperadas pueden calcularse sin necesidad de estimar parámetros poblado- 
nales mediante estadísticos muéstrales. U na demostración de esto se da en el problema 12.18. 

2. u= (h - 1 )(k - 1) - m si las frecuencias esperadas sólo pueden calcularse estimando m parámetros poblacionales 
mediante estadísticos muéstrales. 


Las pruebas de significancia para tablas h x k son similares a las pruebas de significancia para tablas 1 x k. Las 
frecuencias esperadas se establecen basándose en la hipótesis H 0 de que se trate; una de las hipótesis más empleadas 
es que las dos clasificaciones son Independientes una de otra. 

Las tablas de contingencia pueden extenderse a dimensiones mayores. Así, se pueden tener, por ejemplo, tablas 
h x k x 1 , en las que hay tres clasificaciones. 

EJEMPLO 2 En la tabla 12.5 se presenta la manera en que las personas hacen sus declaraciones de impuestos y su nivel de 
estudios. La hipótesis nula es que la manera en que las personas hacen sus declaraciones de impuestos (usando software o sólo lápiz 
y papel) es independiente de su nivel de estudios. La tabla 12.5 es una tabla de contingencia. 


Tabla 12.5 



Nivel de estudios 

M anera 

Preparatoria 

Licenciatura 

M aestría 

Computadora 

23 

35 

42 

Papel y lápiz 

45 

30 

25 


Empleando M IIMITA B para analizar estos datos se obtienen los resultados siguientes. 
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Prueba ji cuadrada: preparatoria, licenciatura, maestría 


Los 

resultados esperados 

se muest r an 

d e ba j 

o de 

los obsi 

Las 

contri buci ones de j ¡ 

cuadrada se 

muest 

r a n 

debaj o di 


preparatoria 1 i ce 

nc i atura 

ma es t 

r í a 

Total 

1 

23 

35 


42 

100 


34. 00 

32. 50 

33 

. 50 



3.559 

0.192 

2. 

157 


2 

45 

30 


25 

100 


34. 00 

32. 50 

33 

. 50 



3.559 

0.192 

2. 

157 


Tot 

al 68 

65 


67 

200 

J ¡ - 

Sq =11.816, DF =2, 

P- Val ue = 0. 

003 




Debido a que el valor p es pequeño, se rechaza la hipótesis de independencia y se concluye que la manera en que 
se hace la declaración de impuestos y el nivel de educación no son Independientes. 


CORRECCIÓN DE YATES POR CONTINUIDAD 

Cuando a datos discretos se aplican fórmulas para datos continuos, como se ha visto en capítulos anteriores, es nece¬ 
sario hacer una corrección por continuidad. Para el empleo de la distribución ji cuadrada hay una corrección similar. 
Esta corrección consiste en reescribir la ecuación (1) de la manera siguiente: 


X 2 (corregida) 


(l°i ~ e i I ~ 0-5) 2 | (\o2 — e 2 | — 0.5) 2 | 
e¡ e 2 


(l°A- ~ e k\ ~~ 0-5) 2 


( 6 ) 


y se le conoce como corrección de Yates. Para la ecuación (5) existe una modificación análoga. 

En general, esta corrección sólo se hace cuando el número de grados delibertad es^= 1. Cuando se tienen mues¬ 
tras grandes, se obtiene prácticamente el mismo resultado que con x 2 no corregida, pero cerca de los valores críticos 
pueden surgir dificultades (ver el problema 12.8). Cuando se tienen muestras pequeñas, donde cada una de las frecuen¬ 
cias esperadas está entre 5 y 10, quizá sea mejor comparar ambos valores de x 2 , el corregido y el no corregido. Si 
ambos valores conducen a la misma conclusión respecto a la hipótesis, por ejemplo al rechazo al nivel 0.05, es raro 
que se encuentren dificultades. Si ambos valores conducen a conclusiones diferentes se puede recurrir a aumentar el 
tamaño déla muestra, o si esto no es posible se pueden usar métodos de probabilidad en los que se emplee la distribu¬ 
ción multinomial del capítulo 6. 


FÓRMULASSENCILLAS PARACALCULAR x 2 

Para calcular x 2 pueden deducirse fórmulas sencillas en las que únicamente se emplean las frecuencias esperadas. 
A continuación se dan las fórmulas para tablas de contingencia 2 x 2 y 2 x 3 (ver las tablas 12.6 y 12.7, respectiva¬ 
mente). 


Tablas 2x2 


2 N(d\b 2 — a 2 b\) 2 NA 1 

(fl[ + b\)(a 2 ~E ^ 2 )(^ i ~E rt 2 ){bi + b 2 ) N¡N 2 N¿N¡¡ 


( 7 ) 
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Tabla 12.6 



1 

II 

Total 

A 

ai 

a 2 

Na 

B 

b i 

b 2 

N b 

Total 

N i 

n 2 

N 


Tabla 12.7 



1 

II 

III 

Total 

A 

ai 



Na 

B 

bi 

b 2 

b 2 

N B 

Total 

«i 

n 2 

W 3 

N 


donde A = - s 2 b 1 , N = a 1 + a 2 + b 1 + b 2 , N 1 = a 1 + b v l\l 2 = a 2 + b 2 , + b 2 , N A = a 1 + a 2 yN B = b 1 + b 2 (ver 

problema 12.19). Empleando la corrección de Yates, esta ecuación se convierte en 


X 2 (corregida) 


N(\c h b 2 -a 2 b\\-{N) 2 __ N( |A|-ljV) 2 

(ci\ + b\)(a 2 + b 2 ){a\ + a 2 )(b\ + b 2 ) N\N 2 N¿N B 


( 8 ) 


Tablas 2x3 


N 

2 2 2 1 
«1 , «2 , a 3 

N 

' b\ b\ b\ 

— 

——b — —b ~zrz~ 

H- 

- - b +T+ - b TT - 

N Á 

N { N 2 N 3 

N b 

N\ N 2 N 3 


(9) 


donde se ha empleado el resultado general válido para todas las tablas de contingencia (ver el problema 12.43): 

x 2 = E -~n (10) 

e i 

La fórmula (9) puede generalizarse a tablas 2 x /c donde /c > 3 (ver el problema 12.46). 


COEFICIENTE DE CONTINGENCIA 


U na medida del grado de relación, asociación o dependencia entre las clasificaciones en una tabla de contingencia es 
la dada por 


C = 



( 11 ) 


que se conoce como coeficiente de contingencia. Cuanto mayor sea el valor de C mayor será el grado de relación entre 
las clasificaciones. El valor máximo de C está determinado por la cantidad de renglones y columnas de la tabla de 
contingencia y este valor n unca es ma yor a 1. Si /c es la cantidad de renglones y columnas en una tabla de contingencia, 
el valor máximo deC es yj(k - 1 )/k (ver los problemas 12.22,12.52 y 12.53). 


EJEMPLO 3 Encontrar el coeficiente de contingencia correspondiente al ejemplo 2. 


C = 



11.816 


11.816 + 200 


0.236 


CORRELACIÓN DE ATRIBUTOS 


Como las clasificaciones de una tabla de contingencia suelen describir características de personas u objetos, a estas 
clasificaciones se les suele llamar atributos y a su grado de dependencia, asociación o relación se le llama correlación 
de atributos. Para tablas /c x k, el coeficiente de correlación entre atributos (o clasificaciones) se define como 


X 


N(k - 1) 




( 12 ) 
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este coeficiente se encuentra entre 0 y 1 (ver el problema 12.24). En tablas 2 x 2 en las que /c = 2, a la correlación se 
le conoce como correlación tetracórica. 

En el capítulo 14 se considera el problema general de la correlación entre variables numéricas. 

PROPIEDAD ADITIVA DE X 2 

Supóngase que como resultado de la repetición de un experimento se obtienen los valores muéstrales de x 2 dados por 
Xi, xL xi • • - con v v u 2 , v 3 ,. .. grados de libertad, respectivamente. Entonces el resultado de todos estos experimentos 
puede considerarse equivalente al valor x 2 dado por xi + Xi + xí 4 — con + v 2 + u 3 4 — grados de libertad (ver 
el problema 12.25). 


PROBLEMAS RESUELTOS 


LA PRUEBAJI CUADRADA 

12.1 En 200 lanzamientos de una moneda se obtienen 115 caras y 85 cruces. Pruebe la hipótesis deque la moneda 
no está cargada a los niveles de significancia: a) 0.05 y b) 0.01, empleando el apéndice IV y c) pruebe esta 
hipótesis calculando el valor p y comparándolo con los niveles 0.05 y 0.01. 


SOLUCIÓN 


L as frecuencias observadas de caras y cruces son o 2 = 115 y o 2 = 85, respectivamente, y las frecuencias esperadas de caras 
y cruces (si la moneda no está cargada) son e x = 100 y e 2 = 100, respectivamente. Por lo tanto, 


(Qi-ei) 2 t (o 2 -e 2 ) 2 (115-100) 2 | (85 - 100) 2 


X' 


100 


100 


Dado que el número de categorías, o clases (caras, cruces), esk = 2, v = k- l = 2- l = l. 

a) El valor crítico x 2 95 para 1 grado de libertad es 3.84. Por lo tanto, como 4.50 > 3.84, al nivel de significancia 0.05 se 
rechaza la hipótesis de que la moneda no está cargada. 

b) El valor crítico x 2 99 para 1 grado de libertad es 6.63. Por lo tanto, como 4.50 < 6.63, al nivel de significancia 0.01 no 
se puede rechazar la hipótesis de que la moneda no está cargada. 

Se concluye que los resultados encontrados tal vez sean significativos y que la moneda quizás esté cargada. Para 
comparar este método con métodos usados antes, ver el problema 12.3. 

Empleando EXCEL, el valor p se obtiene mediante =CHIDIST(4.5,1) queda como resultado 0.0339. Y empleando 
el método del valorp se ve que los resultados son significativos a 0.05, pero no a 0.01. Cualquiera de estos métodos puede 
emplearse para realizar la prueba. 

12.2 Se repite el problema 12.1 empleando la corrección deYates. 


SOLUCIÓN 


X 2 (corregida) 


(| 0l -e,| -0.5) 2 (|o 2 -e 2 | -0.5) 2 _ (|115- 100| - 0.5) 2 (|85 - 100| - 0.5) 2 


-h 

e\ 


+ 


100 


100 



Como 4.205 > 3.84 y 4.205 < 6.63, las conclusiones a las que se llegó en el problema 12.1 son válidas. Para hacer una 
comparación con los métodos anteriores, ver el problema 12.3. 
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12.3 Resolver el problema 12.1 empleando la aproximación normal a la distribución blnomlal. 

SOLUCIÓN 

De acuerdo con la hipótesis de que la moneda no está cargada, la media y la desviación estándar de la cantidad de caras espe¬ 
radas en 200 lanzamientos de una moneda son p = Np = (200)(0.5) = 100 y o = y/Npq = v / (200)(0.5)(0.5) = 7.07, 
respectivamente. 

Primer método 


115 caras en unidades estándar = 1 = 2.12 


AI nivel de significancia 0.05, empleando una prueba de dos colas, la hipótesis de que la moneda no está cargada se recha¬ 
za si la puntuación z que se obtenga cae fuera del intervalo -1.96 a 1.96. Al nivel 0.01 el intervalo correspondiente es -2.58 
a 2.58. Se concluye (como en el problema 12.1) que la hipótesis puede rechazarse al nivel 0.05, pero no al nivel 0.01. 

Obsérvese que el cuadrado de la puntuación estándar anterior es (2.12) 2 = 4.50, que es Igual al valor de x 2 obtenido 
en el problema 12.1. Éste es siempre el caso en una prueba ji cuadrada con dos categorías (ver problema 12.10). 

Segundo método 

Usando la corrección por continuidad 115 o más caras es equivalente a 114.5 o más caras. Entonces 114.5 en unidades 
estándar = (114.5 - 100)/7.07 = 2.05. Esto conduce a la misma conclusión obtenida con el primer método. 

Obsérvese que el cuadrado de la puntuación estándar es (2.05) 2 = 4.20, valor que coincide con el valor dex 2 corre¬ 
gido por continuidad empleando la corrección de Yates en el problema 12.2. Éste es siempre el caso en una prueba ji 
cuadrada en la que haya dos categorías y se emplee la corrección de Yates. 


12.4 En la tabla 12.8 se muestran las frecuencias observadas y las frecuencias esperadas al lanzar un dado 120 
veces. 

a) Pruebe la hipótesis de que el dado no está cargado calculando x 2 y comparando el estadístico de prueba 
encontrado con el valor crítico correspondiente al nivel de significancia 0.05. 

b) Calcule el valor p y compárelo con 0.05 para probar la hipótesis. 


Tabla 12.8 


Cara del dado 

1 

2 

3 

4 

5 

6 

Frecuencias observadas 

25 

17 

15 

23 

24 

16 

Frecuencias esperadas 

20 

20 

20 

20 

20 

20 


SOLUCIÓN 


2 (oí -ei ) 2 (o 2 ~e2 ) 2 | (03~e 3 ) 2 (o 4 - e 4 ) 2 (05 - e 5 f K - e 6 ) 2 

e¡ e 2 e 3 e 4 e¡ e 6 

_ (25 — 20) 2 (17 -20) 2 (15 - 20) 2 (23 - 20) 2 (24 - 20) 2 (16-20) 2 

~ 20 + 20 + 20 + 20 + 20 + 20 ~ ' 

a) Empleando EXCEL, el valor crítico correspondiente a 0.05 se obtiene mediante la expresión =CH11N V(0.05,5), que 
da 11.0705. El valor encontrado para el estadístico de prueba es 5.00. Como el valor encontrado para el estadístico de 
prueba no está en la región crítica 0.05, no se rechaza la hipótesis nula de que el dado no esté cargado. 

b ) Empleando EXCEL, el valorp se obtiene mediante la expresión =CHIDIST(5.00,5), que da 0.4159. Como el valorp 
no es menor a 0.05, no se rechaza la hipótesis nula de que el dado no esté cargado. 
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12.5 En la tabla 12.9 se muestra la distribución de los dígitos 0,1, 2,..., 9 en los 250 dígitos de una tabla de núme¬ 
ros aleatorios, a) Encontrar el valor del estadístico de prueba x 2 , b) encontrar el valor crítico correspondiente 
a a = 0.01 y dar una conclusión y c) encontrar el valor p correspondiente al valor encontrado en el Inciso a) 
y dar una conclusión para a = 0.01. 


Tabla 12.9 


Dígito 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

Frecuencias observadas 

17 

31 

29 

18 

14 

20 

35 

30 

20 

36 

Frecuencias esperadas 

25 

25 

25 

25 

25 

25 

25 

25 

25 

25 


SOLUCIÓN 


a) 


(17 -25) 2 (31 -25) 2 (29 - 25) 2 (18 - 25) 2 (36 - 25) 2 

25 + 25 + 25 + 25 +'"+ 25 


23.3 


b ) El valor crítico correspondiente a 0.01 se obtiene mediante la expresión =CH11N V(0.01,9) y es 21.6660. Como el 
valor obtenido para x 2 es mayor a este valor, se rechaza la hipótesis de que estos números sean aleatorios. 

c) Empleando EXCEL, el valor p se obtiene mediante la expresión =CH IDIST (23.3,9) y es 0.0056, que es menor a 0.01. 
De manera que con la técnica del valor p se rechaza la hipótesis nula. 


12.6 En un experimento empleando chícharos, Gregor M endel observó que315 eran redondosy amarillos, 108 eran 
redondos y verdes, 101 eran deformes y amarillos, y 32 eran deformes y verdes. Deacuerdo con su teoría sobre 
la herencia, estas cantidades debían estar en la proporción 9:3:3:1. ¿Existe alguna evidencia que haga dudar de 
su teoría a los niveles de significancia: a) 0.01 y b) 0.05? 

SOLUCIÓN 


La cantidad total de chícharos es 315 + 108 + 101 + 35 = 556. Como las cantidades esperadas están en la proporción 
9:3:3:1 (y9 + 3 + 3 + l = 16), se esperaría que hubiera 

(556) = 312.75 redondos y amarillos (556) = 104.25 deformes y amarillos 

^ (556) = 104.25 redondos y verdes | l 6 (556) = 34.75 deformes y verdes 


Por lo tanto, 


(315 — 312.75) 2 (108 - 104.25) 2 (101 — 104.25) 2 (32 - 34.75) 2 

312.75 + 104.25 + 104.25 + 34.75 


0.470 


Dado que hay cuatro categorías, k = 4 y el número de grados de libertad es^ = 4- l = 3. 

a) Para u = 3, x %9 = 11 -3; por lo tanto, al nivel 0.01 no puede rechazarse su teoría. 

b) Para v = 3, xis = 7.81; por lo tanto, al nivel 0.05 no puede rechazarse su teoría. 

Se concluye que sí hay coincidencia entre la teoría y la experimentación. 

Obsérvese que para 3 grados de libertad x 2 os = 0.352 y x 2 = 0.470 > 0.352. Por lo tanto, aunque la coincidencia sea 
buena, el resultado obtenido está sujeto a una cantidad razonable de error muestral. 


12.7 En una urna hay una cantidad grande de canicas de cuatro colores: rojas, anaranjadas, amarillas y verdes. En 
una muestra de 12 canicas, tomada de la urna en forma aleatoria, se encuentran 2 canicas rojas, 4 canicas ana¬ 
ranjadas, 4 canicas amarillas y 1 canica verde. Probar la hipótesis de que en la urna las canicas de los distintos 
colores están en la misma proporción. 


SOLUCIÓN 


Bajo la hipótesis de que en la urna hay la misma proporción de canicas de cada color, se esperaría que en una muestra de 
12 canicas hubiera 3 de cada color. Como las cantidades esperadas son menores a 5, la aproximación ji cuadrada será 
errónea. Para evitar esto se fusionan categorías de manera que el tamaño de cada categoría sea por lo menos 5. 
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Si se desea rechazar la hipótesis habrá que combinar las categorías de manera que la evidencia contra la hipótesis 
sea la mejor posible. En tal caso, esto se logra formando las categorías "rojas o verdes" y "anaranjadas o amarillas", con lo 
cual las muestras serán de 3 y 9 canicas, respectivamente. Como la cantidad esperada en cada categoría, de acuerdo con la 
hipótesis de proporciones iguales, es 6, se tiene 

Para v = 2 -1 = 1, xüs = 3.84. Por lo tanto, al nivel de significancia 0.05 no se puede rechazar la hipótesis (aunque 
sí al nivel de significancia 0.10). Por supuesto que los resultados obtenidos pueden deberse únicamente a la casualidad aun 
cuando los distintos colores estén en la misma proporción. 

Otro método 

Empleando la corrección deYates, se encuentra 

a_(|3 — 6| — 0.5) 2 (|9 - 6| - 0.5) 2 _ (2.5) 2 (2.5) 2 _ „ 

X 6 6 6 6 


lo que conduce a la misma conclusión obtenida antes. Esto era de esperarse, ya que la corrección deYates siempre reduce 
el valor dex 2 - 

N ótese que empleando la aproximación x 2 , aun cuando las frecuencias son demasiado pequeñas, se obtiene 


2_ (2-3) 2 (5-3) 2 (4 — 3) 2 (1-3) 2 

A. o ' O ' 


3.33 


Como v = 4 - 1 = 3, x 2 95 = 7.81 y se llega a la misma conclusión que antes. Infortunadamente, cuando las frecuencias 
son pequeñas, la aproximación x 2 es pobre; por lo tanto, cuando no sea recomendable combinar frecuencias hay que recu¬ 
rrir a los métodos exactos de probabilidad del capítulo 6. 


12.8 En 360 lanzamientos de un par de dados se obtuvo 74 veces un 7 y 24 veces un 11. Empleando como nivel de 
significancia 0.05 pruebe la hipótesis de que el dado no está cargado. 

SOLUCIÓN 


U n par de dados pueden caer de 36 maneras. El número once se puede obtener de 6 maneras y el número siete de 2 mane¬ 
ras. Entonces Prjsiete} = ^ = i y Prjonce} = ¿ = i Por lo tanto, en 360 lanzamientos se esperan i(360) = 60 sietes y 
i (360) = 20 onces, de manera que 


X 


2 


(74- 60) 2 (24-20) 2 

60 20 


Para 12 = 2 —1 = 1, x 2 95 = 3.84. Por lo tanto, como 4.07 > 3.84, se estará inclinado a rechazar la hipótesis de que 
el dado no está cargado. Sin embargo, empleando la corrección deYates se encuentra 


X 2 (corregida) 


(|74 — 60| — 0.5) 2 (|24 — 20| — 0.5) 2 

60 + 20 


(13-5) 2 (3.5) 2 

60 20 


3.65 


Así, de acuerdo con el valor dex 2 corregida, no se puede rechazar la hipótesis al nivel 0.05. 

En general, con muestras grandes como las que se tienen en este caso, los resultados empleando la corrección de 

Yates son más confiables que sin usar la corrección deYates. Sin embargo, como aun el valor corregido de x 2 está tan 
cercano al valor crítico, se estará indeciso para tomar una decisión en un sentido o en otro. En tales casos, quizá lo mejor 
sea aumentar el tamaño de la muestra si, por alguna razón, se está especialmente interesado en el nivel 0.05; si no es así, se 

puede rechazar la hipótesis a algún otro nivel (por ejemplo, al nivel 0.10) si esto es satisfactorio. 


12.9 Se estudian 320 familias de 5 hijos cada una y se encuentra la distribución que se muestra en la tabla 12.10. 
¿Este resultado es consistente con la hipótesis de que el nacimiento de un hombreo de una mujer es igualmen¬ 
te probable? 
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Tabla 12.10 


Cantidad de niños 
y niñas 

5 niños 

0 niñas 

4 niños 

1 niña 

3 niños 

2 niñas 

2 niños 

3 niñas 

1 niño 

4 niñas 

0 niños 

5 niñas 

Total 

Cantidad de familias 

18 

56 

110 

88 

40 

8 

320 


SOLUCIÓN 

Sea p = probabilidad de que nazca un hombre y q = 1 - p = probabilidad de que nazca una mujer. Entonces las probabi¬ 
lidades de (5 niños), (4 niños y 1 niña),..(5 niñas) están dadas por los términos de la expansión binomial 

( p + q) 5 = p 5 + 5p 4 q + 10 p 3 q 1 + 10 p 2 q 3 + 5pq 4 + q 5 

Si p = q = se tiene 

Pr {5 niños y 0 niñas} = (|) 5 = ^ Pr {2 niños y 3 niñas} = 10@ 2 (|) 3 = 

Pr{4 niños y 1 niña} = 5(|) 4 @ = ^ Pr{l niño y 4 niñas} = 5(^)(^) 4 = ^ 

Pr {3 niños y 2 niñas} = 1O0 3 (|) 2 = || Pr {0 niños y 5 niñas} = 0 5 = ^ 

Por lo que las cantidades esperadas de familias con 5, 4, 3, 2, 1 y 0 niños se obtienen multiplicando las probabilidades 

anteriores por 320, y los resultados son 10, 50,100,100, 50 y 10, respectivamente. Por lo tanto, 

2 (18 — 10) 2 , (56- 50) 2 , (110 — 100) 2 , (88 - 100) 2 , (40 - 50) 2 , (8 - 10) 2 

X 10 + 50 + 100 + 100 + 50 + 10 

Como x 2 95 = 11 1 y x 2 99 = 15.1 para u= 6 - 1 = 5 grados de libertad, la hipótesis nula puede rechazarse al nivel 
de significancia 0.05, pero no al nivel de significancia 0.01. De manera que se concluye que los resultados tal vez sean 
significativos y que el nacimiento de hombres y mujeres no es igualmente probable. 

12.10 En 500 personas estudiadas se encontró que la semana pasada 155 de ellas habían rentado por lo menos un 
video. Empleando una prueba de dos colas y a = 0.05, probar la hipótesis de que la semana pasada el 25% de 
la población rentó por lo menos un video. Realizar la prueba empleando tanto la distribución normal estándar 
como la distribución ji cuadrada. M ostrar que la prueba ji cuadrada con sólo dos categorías es equivalente a la 
prueba de significancia para proporciones dada en el capítulo 10. 

SOLUCIÓN 

Si la hipótesis nula es verdadera, entonces p = Np = 500(0.25) = 125 y a = , JNpq = ^500(0.25)(0.75) = 9.68. El 
estadístico de prueba calculado esZ = (155 - 125J/9.68 = 3.10. Los valores críticos son ±1.96, por lo que la hipótesis 
nula se rechaza. 

La solución empleando la distribución ji cuadrada se halla empleando los resultados que se muestran en la tabla 

12.11. 


Tabla 12.11 


Frecuencias 

Rentaron videos 

No rentaron videos 

Total 

Observadas 

155 

345 

500 

Esperadas 

125 

375 

500 


El estadístico ji cuadrada calculado se obtiene como sigue: 

2 _ (155 — 125) 2 (345 — 375) 2 

X ~ 125 + 375 


= 9.6 


El valor crítico para un grado de libertad es 3.84, por lo que se rechazó la hipótesis nula. Obsérvese que (3.10) 2 = 
9.6 y que (±1.96) 2 = 3.84, o seaZ 2 = x 2 - Los dos procedimientos son equivalentes. 
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12.11 a) Probar que la fórmula (1) de este capítulo puede escribirse como 

2 „ of 

x 2 = EÍ~n 

j 

b) Utilizar el resultado dea) para comprobar el valor de% 2 calculado en el problema 12.6. 

SOLUCIÓN 

a) Por definición 


x 2 = j , (°/~ e /) 2 = v ~ 2 o J e J + e ^ 

2 2 q 2 

= £ J -2£ 0 , + £e, = £ J -2tf + AT=£^-.Y 
e j e i e .i 

donde se ha empleando la fórmula (2) de este capítulo. 


b ) 


X—^ O i 


(315)- 

312.75 


(108) 2 (101) 2 
104.25 + 104.25 


(32) 2 

34.75 


- 556 = 0.470 


BONDAD DE AJ USTE 

12.12 U n jugador de tenis se entrena jugando series de tres juegos; lleva un registro de los juegos perdidos y ganados 
en estas series a lo largo del año. Su registro muestra que de 250 días, 25 días ganó 0 juegos, 75 días ganó 1 
juego, 125 días ganó 2 juegos y 25 días ganó 3 juegos. Con a = 0.05, probar queX = cantidad de juegos 
ganados, en las series de 3, está distribuida en forma blnomlal. 

SOLUCIÓN 

La cantidad media de juegos ganados en estas serles de 3 juegos es (0 x 25 + 1 x 75 + 2 x 125 + 3 x 25J/250 = 1.6. SI 
X es blnomlal, la media es np = 3p, lo cual Igualándolo al estadístico 1.6 y despejando p permite encontrar que p = 0.53. 
Se desea probar queX es binomlal con n = 3 y p = 0.53. SI X es b¡normal con p = 0.53, su distribución y el número espe¬ 
rado de juegos ganados son los que muestran los siguientes resultados de EXCEL. Obsérvese que las probabilidades bino¬ 
mlal es p(x) se encontraron ingresando =BINOM DIST(A2,3,0.53,0) y haciendo clic y arrastrando desde B2 hasta B5. De 
esta manera se obtuvieron los valores que se muestran a continuación bajo p(x). 


X 

p(x) 

Ganados esperados 

Ganados observados 

O 

0.103823 

25.95575 

25 

1 

0.351231 

87.80775 

75 

2 

0.396069 

99.01725 

125 

3 

0.148877 

37.21925 

25 


La cantidad de juegos ganados esperados se encuentra multiplicando los valores dep(x) por 250. 

2 _ (25 — 30.0) 2 (75 — 87.8) 2 (125 - 99.0) 2 (25 - 37.2) 2 

X ~ 304) + 8T8 + 994) + 3T2 “ ' 

Como la cantidad de parámetros necesarios para estimar las frecuencias esperadas esm = 1 (a saber, el parámetro p 
de la distribución binomlal), v mk - 1 - m = 4 - 1 - 1 == 2. El valor p se obtiene mediante la expresión de EXCEL 
=CHIDIST(12.73,2) = 0.0017, por lo que se rechaza la hipótesis de que la variableX esté distribuida en forma binomlal. 

12.13 El número de horas por semana que 200 estudiantes universitarios usan internet se ha agrupado en las clases 
0 a 3, 4 a 7, 8 a 11,12 a 15,16 a 19, 20 a 23 y 24 a 27, cuyas frecuencias observadas son 12, 25, 36, 45, 34, 31 
y 17. A partir de estos datos se obtiene la media y la desviación estándar de estos datos agrupados. La hipótesis 
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nula es que estos datos están distribuidos normalmente. De acuerdo con la media y con la desviación estándar 
encontradas y suponiendo que la distribución sea normal, se obtienen las frecuencias esperadas que, redondea¬ 
das, son las siguientes: 10, 30, 40, 50, 36, 28 y 6. 

a) Encontrarx 2 - 

b) ¿Cuántos grados de libertad tiene x 2 ? 

c) Empleando EXCEL, encontrar el valor crítico del 5% y dar las conclusiones al 5%. 

d) Empleando EXCEL, hallar el valorp para el resultado. 

SOLUCIÓN 

a) En la figura 12-1 se muestra parte de la hoja de cálculo de EXCEL.EnC2 se Ingresa =(A2-B2) / '2/B2, se hace clic y 
se arrastra desde C2 hasta C8. En C9 se ingresa =SUM (C2:C8). Como se ve, x 2 = 22.7325. 



A 

B 

c 

D 

1 

observed 

expected 

(0- E)”2/E 


2 

12 

10 

0 4 


3 

25 

30 

0 8333333 


4 

36 

40 

0 4 


6 

45 

50 

05 


6 

34 

36 

0 1111111 


7 

31 

28 

0 3214286 


8 

17 

6 

20 166667 


9 



22 73254 


10 






Figura 12-1 EXCEL, parte de la hoja de cálculo para el problema 12.13. 


b ) Como el número de parámetros empleados para estimar las frecuencias esperadas es m = 2 (comúnmente son la media 

H y la desviación estándar a de una distribución normal), u= k - 1 - 7 - 1 - 2 »4. Obsérvese que no es 

necesario combinar clases, ya que todas las frecuencias esperadas son mayores a 5. 

c) El valor crítico de 5% se obtiene mediante =CHIINV(0.05,4) y es 9.4877. Como 22.73 es mayor al valor crítico, se 
rechaza la hipótesis nula de que los datos provengan de una distribución normal. 

d) El valorp se encuentra mediante =C HIDIST (22.7325,4), queda valorp = 0.000143. 


TABLASDE CONTINGENCIA 

12.14 Se repite el problema 10.20 usando, primero, la prueba ji cuadrada, y después M INITAB. Comparar las dos 
soluciones. 

SOLUCIÓN 

En la tabla 12.12a) se presentan las condiciones del problema. Bajo la hipótesis nula de que el suero no tiene efecto alguno, 
se esperaría que en cada grupo se recuperaran 70 personas y 30 no, como se muestra en la tabla 12.12b). Obsérvese que la 
hipótesis nula es equivalente a afirmar que la recuperación es independiente del uso del suero (es decir, que las clasifica¬ 
ciones son independientes). 


Tabla 12.12a) F recuencias observadas 



Recuperados 

No 

recuperados 

Total 

Grupo A (usan el suero) 

75 

25 

100 

Grupo B (no usan el suero) 

65 

35 

100 

Total 

140 

60 

200 
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Tabla 12.12b) Frecuencias esperadas bajo H 0 



Recuperados 

No 

recuperados 

Total 

Grupo A (usan el suero) 

70 

30 

100 

Grupo B (no usan el suero) 

70 

30 

100 

Total 

140 

60 

200 


2 _ (75 - 70) 2 (65 - 70) 2 (25 - 30) 2 (35 - 30) 2 _ 

* “ 70 + 70 + 30 + 30 


Para determinar el número de grados de libertad, considérese la tabla 12.13, que es la misma tabla 12.12, excepto 
que sólo muestra los totales. Es claro que en cualquiera de las cuatro celdas vacías sólo se tiene la libertad de colocar un 
número, ya que una vez hecho esto los números de las celdas restantes quedan determinados de manera única por los tota¬ 
les dados. Por lo tanto, hay 1 grado de libertad. 


Tabla 12.13 



Recuperados 

No 

recuperados 

Total 

Grupo A 



100 

Grupo B 



100 

Total 

140 

60 

200 


Otro método 

Empleando la fórmula (ver problema 12.18), u = [h - l)(k - 1) = (2 - 1)(2 - 1) = 1. Como x 2 k = 3.84 para 1 grado 
de libertad y como \ 2 = 2.38 < 3.84, se concluye que los resultados no son significativos al nivel 0.05. Por lo tanto, 
no se puede rechazar H 0 a este nivel, y se concluye que el suero no es efectivo o se aplaza la decisión hasta tener más 
resultados. 

Obsérvese que x 2 = 2.38 es el cuadrado de la puntuación z, z = 1.54, que se obtuvo en el problema 10.20. E n gene¬ 
ral, la prueba ji cuadrada para proporciones muéstrales en una tabla de contingencia 2 x 2 es equivalente a una prueba de 
significancia para la diferencia entre proporciones usando la aproximación normal. 

Nótese también que una prueba de una cola empleando x 2 es equivalente a una prueba de dos colas empleando x> 
yaque, por ejemplo, x 2 > x Z 95 corresponde a x > x .95 o x < -x. 95 ' Como en tablas 2 x 2 x 2 es el cuadrado de la puntua¬ 
ción z, se sigue que, en este caso, x es Igual a z. Por lo tanto, el rechazo de una hipótesis al nivel 0.05 empleando x 2 es 
equivalente al rechazo de una prueba de dos colas al nivel 0.10 empleando z. 


Prueba ji cuadrada: recuperación, no recuperación 


Los 

resultados esperados 

s e 

muest r a n 

de baj 

0 de los obsei 

■vados 

Las 

contribuciones de j 1 

c u 

adrada se 

muest 

r an debajo de 

los resultados 


Recuperad ó n 

No 

r ec u per a c 

1 ón 

Total 


1 

75 



25 

100 



70. 00 


30 

. 00 




0.357 


0 . 

833 



2 

65 



35 

100 



70. 00 


30 

. 00 




0.357 


0 . 

833 



Tot 

al 140 



60 

200 



J i - S q =2. 3 81, DF =1, P-Val ue=0. 123 
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12.15 Resolver el problema 12.14 empleando la corrección deYates. 

SOLUCIÓN 


X 2 { corregida) = 


(|75 — 70| — 0.5) 2 (|65 — 70| — 0.5) 2 (|25 - 30| - 0.5) 2 (|35 — 30| — 0.5) 2 


70 


- + - 


70 


- + - 


30 


- + - 


30 


= 1.93 


Por lo tanto, las conclusiones a las que se llegó en el problema 12.14 son correctas. Esto era de suponer sabiendo que la 
corrección deYates siempre hace disminuir el valor de x 2 - 


12.16 U na empresa de teléfonos celulares realiza una encuesta para determinar la proporción de personas que tienen 
teléfono celular en los distintos grupos de edad. En la tabla 12.14 se muestran los resultados obtenidos en 100 
hogares. Probar la hipótesis de que en los diferentes grupos de edad, las proporciones de personas que tienen 
teléfono celular son las mismas. 


Tabla 12.14 


Teléfono celular 

18-24 

25-54 

55-64 

>65 

Total 

Sí 

50 

80 

70 

50 

250 

No 

200 

170 

180 

200 

750 

Total 

250 

250 

250 

250 

1000 


SOLUCIÓN 

De acuerdo con la hipótesis de que la proporción de personas que tienen teléfono celulares la misma en los distintos grupos 
de edad, 250/1 000 = 25% es una estimación del porcentaje de personas que tienen teléfono celular en cada grupo de edad 
y 75% es una estimación del porcentaje de personas que no tienen teléfono celular en cada grupo de edad. En la tabla 12.15 
se presentan las frecuencias esperadas en cada grupo de edad. 

El valor del estadístico ji cuadrada se puede encontrar como se muestra en la tabla 12.16. 

El número de grados de libertad para la distribución ji cuadrada es v= (h - l)(k — 1) = (2 1)(4 1) = 3. Como 

X 2 95 = 7.81, y 14.3 es mayor que 7.81, se rechaza la hipótesis nula y se concluye que los porcentajes en los cuatro grupos 
de edad no son los mismos. 


Tabla 12.15 


Teléfono celular 

18-24 

25-54 

55-64 

>65 

Total 

Sí 

25% de 250 = 62.5 

25% de 250 = 62.5 

25% de 250 = 62.5 

25% de 250 = 62.5 

250 

No 

75% de 

75% de 

75% de 

75% de 

750 


250 = 187.5 

250 = 187.5 

250 = 187.5 

250 = 187.5 


Total 

250 

250 

250 

250 

1000 


Tabla 12.16 


Renglón, columna 

0 

e 

(o -e) 

(o - e) 2 

(o - e) 2 /e 

1,1 

50 

62.5 

-12.5 

156.25 

2.5 

1,2 

80 

62.5 

17.5 

306.25 

4.9 

1,3 

70 

62.5 

7.5 

56.25 

0.9 

1,4 

50 

62.5 

-12.5 

156.25 

2.5 

2,1 

200 

187.5 

12.5 

156.25 

0.8 

2,2 

170 

187.5 

-17.5 

306.25 

1.6 

2,3 

180 

187.5 

-7.5 

56.25 

0.3 

2,4 

200 

187.5 

12.5 

156.25 

0.8 

Suma 

1000 

1000 

0 


14.3 
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12.17 Utilizar M INITAB para resolver el problema 12.16. 

SOLUCIÓN 

A continuación se presenta la solución que da M INITA B al problema 12.16. Las cantidades observadas y esperadas se 
presentan junto con los cálculos del estadístico de prueba. Obsérvese que la hipótesis nula se rechazará a cualquier nivel de 
significancia mayor a 0.002. 


Muestra de datos 


Fila 18 

- 2 4 2 5 

- 54 

55 

- 6 4 6 5 0 má s 



1 

50 

80 


7 0 5 0 



2 

200 

170 


180 200 



MTB > c h i 

squar e el- 

c 4 





Prueba ji cuadrada 






Los r es ul 

t a dos es pe 

r ados s 

e 

muestran debajo de 

1 os 

0 b: 


18-24 

25-54 


5 5 - 6 4 6 5 0 más 

To 

t a 1 

1 

50 

80 


7 0 5 0 


250 


62.50 

62. 50 


62.50 62.50 



2 

200 

170 


180 200 


750 


187.50 

187.50 


187.50 187.50 



Total 

250 

250 


250 250 

1 

000 

J ¡ - Sq = 

2.500 + 

4. 900 

+ 

0.900 + 2.500 + 




0.833 + 

1.633 

+ 

0.300+ 0.833= 

14. 

400 

DF = 3, P 

-Valué = 0 

. 002 






12.18 M ostrar que en una tabla de contingencia deh x k, el número de grados de libertad es (h - l)(k - 1), donde 
h > 1 y k > 1 . 

SOLUCIÓN 

En una tabla con h renglones y k columnas únicamente se puede dejar sin introducir un número en cada renglón y en cada 
columna, ya que estos números se determinan conociendo los totales de cada columna y de cada renglón. Por lo tanto, sólo 
se tiene la libertad de colocar (h - l)(k - 1) números en la tabla, los números restantes quedan determinados automática¬ 
mente y de manera única. Por lo tanto, el número de grados de libertad es (h - 1 )(k - 1). Obsérvese que este resultado es 
válido si se conocen los parámetros poblacionales necesarios para obtener las frecuencias esperadas. 

12.19 a) Demostrar que para la tabla de contingencia 2x2 que se muestra en la tabla 12.17a), 

2 iV(ai¿>2 - « 2 M 2 
X “ N\N 2 N a N b 

b) I lustrar el resultado de a) empleando los datos del problema 12.14. 


Tabla 12.17a) Resultados observados 



1 

II 

Total 

A 

ai 

a 2 

Na 

B 

bi 

h 

N b 

Total 

N 1 

n 2 

N 


Tabla 12.17b) Resultados esperados 



1 

II 

Total 

A 

NiN a /N 

N 2 N a /N 

Na 

B 

Wj/Vg/W 

N 2 N b /N 

N B 

Total 

Ni 

n 2 

N 
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SOLUCION 


a) Como en el problema 12.14, los resultados esperados, basándose en la hipótesis nula, se presentan en la tabla 12.17b). 
Entonces, 

2 _{d x -N x N A /N) 2 («2 — N 2 N a /N) 2 (b x -N x N B /N) 2 ( b 2 -N 2 N B /N) 2 

A AT AT / AT I AT AT / A T ' A T A T l A T * 


Ni N Á /N 


N 2 N a / N 


N X N B /N 


N 2 N b /N 


Pero 


De manera similar 


N x N a (¿íi -f- b\)(ci\ 4- d 2 ) fl\b 2 — ®ib\ 

a \ -TT = a l 


d 2 


N 

N 2 N a 

N 


y b i - 


ü\ 4- b\ 4- a 2 + b 2 
N X N B 


N 


N 


y b 2 - 


n 2 n b 

N 


son también igual a 

Por lo tanto, se puede escribir 


d\b 2 — a 2 b\ 

Ñ 


2 N (a.\b 2 — a 2 bi\ 2 i N (a x b 2 — a 2 b 2 


X = 


NiN a 


N 


+ 


N 2 N a V N 


N (d\b 2 — a 2 b{\ N (a\b 2 — a 2 b\ 


N\ N, 


N 


N-tN B 


N 


de donde, simplificando, se obtienen 


N(d\b 2 — d 2 b\j > 
N x N 2 N a N b 


b ) 


En el problema 12.14, a : = 75, a 2 = 25, b 2 = 65, b 2 = 35, N 1 = 140, W 2 = 60, N A = 100, W B = 100 y N = 200; enton¬ 
ces, como se obtuvo antes, 


2 200[(75)(35) — (25) (65)] 2 

X (140)(60)( 100)(100) 

Empleando la corrección deYates se llega al mismo resultado que en el problema 12.15: 


X 2 (corregida) 


N(\a x b 2 - a 2 b x \-\N ) 2 _ 200[|(75)(35) - (25)(65)| - 100] 2 
N x N 2 N a N b “ (140) (60) (100) (100) 


1.93 


12.20 A 900 hombres y 900 mujeres se les preguntó si deseaban que hubiera más programas federales de ayuda para 
el cuidado de los niños. Cuarenta por ciento de las mujeres y 36 por ciento de los hombres respondieron que 
sí. Probar con a = 0.05 la hipótesis nula de estos porcentajes ¡guales contra la hipótesis alternativa de estos 
porcentajes diferentes. M ostrar que la prueba j i cuadrada para dos proporciones muéstrales es equivalente a la 
prueba de significancia para diferencias empleando la aproximación normal del capítulo 10. 

SOLUCIÓN 


Bajo la hipótesis H 0 , 

Vp,-p 2 = 0 y a P¡ _p 2 = + = ^( 0 . 38 )( 0 . 62 )^ + ^ = 0.0229 

dondep se estima fusionando las proporciones de las dos muestras. Es decir, 


360 + 324 
900 + 900 


0.38 y 


<? = 


0.38 = 0.62 


El estadístico de prueba para la aproximación normal es el siguiente: 

7 _P\~ P 2 _ 0.40 - 0.36 
~ a p¡ _p 2 ~ 0.0229 


1.7467 
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El resultado que da M INITAB del análisis ji cuadrada es el siguiente: 


Prueba ji cuadrada 


Los 

resultados es 

pe r a do s se 

mu e s t r 


ma 1 es 

f ema 1 es 

Total 

1 

324 

360 

684 


342.00 

342.00 


2 

576 

549 

1 116 


558.00 

558.00 


Tot 

al 900 

900 

1 800 

J ¡ - 

Sq = 0.947 + 0 

. 9 4 7 + 



0.581 + 0. 

581 = 3.056 


DF 

= 1, P- Val ue = 

0. 080 



El cuadrado del estadístico de prueba normal es (1.7467) 2 = 3.056, que es el valor del estadístico ji cuadrada. Las dos 
pruebas son equivalentes. Los valores p son siempre los mismos para las dos pruebas. 


COEFICIENTE DE CONTINGENCIA 

12.21 Encontrar el coeficiente de contingencia correspondiente a los datos de la tabla de contingencia del problema 
12.14. 

SOLUCIÓN 


c = 



2.38 


2.38 + 200 


\/0.01176 = 0.1084 


12.22 Encontrar el valor máximo deC correspondiente a la tabla 2 x 2 del problema 12.14. 

SOLUCIÓN 

El valor máximo deC se presenta cuando las dos clasificaciones son perfectamente dependientes o están muy bien relacio¬ 
nadas. En ese caso, todos los que toman el suero sanan y todos los que no lo toman no sanan. La tabla de contingencia, 
entonces, será como la tabla 12.18. 


Tabla 12.18 



Sanados 

No 

sanados 

Total 

Grupo A (usan el suero) 

100 

0 

100 

Grupo B (no usan el suero) 

0 

100 

100 

Total 

100 

100 

200 


Dado que las frecuencias de celda esperadas, suponiendo completa independencia, son todas igual a 50, 


X 


2 


(100- 50) 2 (0 — 50) 2 (0 — 50) 2 (100- 50) 2 

50 + 50 + 50 + 50 


200 


Por lo tanto, el máximo valor de C es \/x 2 /(x 2 + TV) = \/200/(200 + 200) = 0.7071. 
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En general, para que exista dependencia perfecta en una tabla de contingencia en la que la cantidad de renglones 
y de columnas son ambas Igual a k, las únicas frecuencias de celda distintas de cero deben encontrarse en la diagonal que 
va de la esquina superior izquierda a la esquina inferior derecha de la tabla de contingencia. En tales casos, 
Cmáx = ~ !)/£■ ¿ Ver los problemas 12.52 y 12.53.) 

CORRELACIÓN DE ATRIBUTOS 

12.23 Encontrar el coeficiente de correlación correspondiente a la tabla 12.12 del problema 12.14: a) sin corrección 
de Yates y b) con corrección. 

SOLUCIÓN 

a) Como x 2 = 2.28, N = 200 y k = 2, se tiene 


X 

N(k — 1) 

lo que indica una correlación muy pequeña entre la recuperación de la salud y el uso del suero. 
b) De acuerdo con el problema 12.15, r (corregida) = ^1.93/200 = 0.0982. 

12.24 Demostrar que el coeficiente de correlación para tablas de contingencia, definido por la ecuación (12) de este 
capítulo, se encuentra entre 0 y 1. 

SOLUCIÓN 

De acuerdo con el problema 12.53, el valor máximo de \/x 2 /(x 2 + N ) es V(k - l)/&. Por lo tanto, 

k X 2 < (k - \)( X 2 + N) k X 2 <k X 2 -X 2 + kN-N 

X~ + N k 

y r -\/v(F^ sl 

Como x 2 > 0. r > 0. Por lo tanto, 0 < r < 1, que es lo requerido. 

PROPIEDAD ADITIVA DE x 2 

12.25 Para probar una h¡ pótesis H 0 , se repite un experimento tres veces. L os valores que se obtienen para x 2 son 2.37, 
2.86 y 3.54, cada uno de los cuales corresponde a 1 grado de libertad. M ostrar que aunque no puede rechazar¬ 
se H 0 , al nivel 0.05, con base en ninguno de estos experimentos, sí puede rechazarse fusionando los tres expe¬ 
rimentos. 

SOLUCIÓN 

El valor de x 2 que se obtiene fusionando los resultados de los tres experimentos es, de acuerdo con la propiedad aditiva, 
X 2 = 2.37 + 2.86 + 3.54 = 8.77 con 1 + 1 + 1 = 3 grados de libertad. Como xss P ara 3 grados de libertad es 7.81, se 
puede rechazar H 0 al nivel de significancia 0.05. Pero como para 1 grado de libertad x 2 9 ¡ = 3.84, basándose en cualquiera 
de los tres experimentos, no se puede rechazar H 0 . 

Cuando se fusionan experimentos en los que se han obtenido valores de x 2 que corresponden a 1 grado de libertad, 
se omite la corrección deYates debido a que ésta tiende a sobrecorregir. 


= 0.1091 
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PROBLEMAS SUPLEMENTARIOS 


LA PRUEBA JI CUADRADA 

12.26 En 60 lanzamientos de una moneda se obtuvieron 37 caras y 23 cruces. Empleando como niveles de significancia: a) 0.05 
y b ) 0.01, probar la hipótesis de que la moneda no está cargada. 

12.27 Resolver el problema 12.26 empleando la corrección de Yates. 

12.28 Durante algún tiempo, las puntuaciones dadas a los alumnos por un grupo de profesores de determinada materia fueron, en 
promedio: 12% Aes; 18% Bes; 40% Ces; 18% Des, y 12% Efes. Durante dos semestres, un profesor nuevo da 22 Aes, 34 
Bes, 66 Ces, 16 Des y 12 Efes. Al nivel de significancia 0.05, determinar si el nuevo profesor sigue el patrón de califica¬ 
ciones establecido por los otros profesores. 

12.29 Tres monedas se lanzan 240 veces anotando cada vez la cantidad de caras y de cruces que se obtienen. En la tabla 12.19 se 
muestran los resultados junto con los resultados esperados bajo la hipótesis de que las monedas no están cargadas. Probar 
esta hipótesis al nivel de significancia 0.05. 


Tabla 12.19 



0 caras 

1 cara 

2 caras 

3 caras 

Frecuencias observadas 

24 

108 

95 

23 

Frecuencias esperadas 

30 

90 

90 

30 


12.30 En la tabla 12.20 se muestra el número de libros prestados en una biblioteca pública a lo largo de determinada semana. 
Probar la hipótesis de que el número de libros que se prestan no depende del día de la semana; usar los niveles de signifi¬ 
cancia: a) 0.05 y b ) 0.01. 


Tabla 12.20 



Lunes 

M artes 

M ¡ércoles 

J ueves 

Viernes 

Cantidad de libros 
prestados 

135 

108 

120 

114 

146 


12.31 U na urna contiene 6 canicas rojas y 3 canicas blancas. Se sacan en forma aleatoria dos canicas de la urna, se anotan sus 
colores y se devuelven a la urna. Este proceso se realiza 120 veces, los resultados obtenidos se presentan en la tabla 
12 . 21 . 

a) Determinar las frecuencias esperadas. 

b) AI nivel de significancia 0.05, determinar si los resultados obtenidos son consistentes con los resultados esperados. 


Tabla 12.21 



0 rojas 

2 blancas 

1 roja 

1 blanca 

2 rojas 

0 blancas 

Número de extracciones 

6 

53 

61 


12.32 Se toman en forma aleatoria 200 pernos de la producción de cada una de cuatro máquinas. La cantidad de pernos defectuo¬ 
sos que se encuentran es 2, 9,10 y 3. Empleando como nivel de significancia 0.05, determinar si hay una diferencia signi¬ 
ficativa entre las máquinas. 
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BONDAD DE AJ USTE 

12.33 a) Emplear la prueba ji cuadrada para determinar la bondad de ajuste de los datos de la tabla 7.9 del problema 7.75. 
b) ¿Es el ajuste "demasiado bueno"? Emplear el nivel de significancia 0.05. 

12.34 Usar la prueba ji cuadrada para determinar la bondad de ajuste de los datos: a) de la tabla 3.8 del problema 3.59 y b) de la 
tabla 3.10 del problema 3.61. Usar el nivel de significancia 0.05 y determinar, en cada caso, si el ajuste es "demasiado 
bueno". 

12.35 Usar la prueba ji cuadrada para determinar la bondad de ajuste de los datos: a) de la tabla 7.9 del problema 7.75 y b) de la 
tabla 7.12 del problema 7.80 ¿Es el resultado obtenido en a) consistente con el del problema 12.33? 


TABLAS DE CONTINGENCIA 

12.36 La tabla 12.22 muestra el resultado de un experimento para investigar el efecto que tiene la vacunación contra determinada 
enfermedad en los animales de laboratorio. Empleando el nivel de significancia: a) 0.01 y b) 0.05, probar la hipótesis de 
que no hay diferencia entre el grupo vacunado y el no vacunado (es decir, la vacunación y la enfermedad son independien¬ 
tes). 


Tabla 12.22 Tabla 12.23 



Adquirieron la 
enfermedad 

No adquirieron la 
enfermedad 

Vacunados 

9 

42 

No vacunados 

17 

28 



Aprobaron 

No aprobaron 

Grupo A 

72 

17 

Grupo B 

64 

23 


12.37 Resolver el problema 12.36 empleando la corrección de Yates. 

12.38 En la tabla 12.23 se presenta la cantidad de estudiantes dedos grupos, /A y 6, que aprobaron y que no aprobaron un examen 
realizado a ambos grupos. Empleando el nivel de significancia: a) 0.05 y b ) 0.01, probar la hipótesis de que no hay dife¬ 
rencia entre los dos grupos. Resolver el problema con corrección de Yates y sin ella. 

12.39 De un grupo de pacientes que se quejaba de no dormir bien, a algunos se les dieron unas pastillas para dormir, en tanto que 
a otros se les dieron pastillas de azúcar (aunque todos pensaban que se les daban pastillas para dormir). Después se les 
interrogó acerca de si las pastillas les habían ayudado a dormir o no. En la tabla 12.24 se muestran los resultados obtenidos. 
Suponiendo que todos los pacientes digan la verdad, probar la hipótesis de que no hay diferencia entre las pastillas para 
dormir y las pastillas de azúcar, empleando como nivel de significancia 0.05. 


Tabla 12.24 



Durmió 

bien 

No durmió 
bien 

Tomó pastillas para dormir 

44 

10 

Tomó pastillas de azúcar 

81 

35 


12.40 En relación con determinada propuesta de interés nacional, los votos de demócratas y republicanos son como se muestra 
en la tabla 12.25. AI nivel de significancia: a) 0.01 y b ) 0.05, probar la hipótesis de que, en lo referente a esta propuesta, no 
hay diferencia entre los dos partidos. 
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Tabla 12.25 



A favor 

En contra 

Indeciso 

Demócratas 

85 

78 

37 

Republicanos 

118 

61 

25 


12.41 En la tabla 12.26 se muestra la relación que hay entre el desempeño de los estudiantes en matemáticas y en física. Probar 
la hipótesis de que el desempeño en matemáticas es Independiente del desempeño en física, empleando el nivel de signifi¬ 
cancia: a) 0.05 y b) 0.01. 


Tabla 12.26 



M atemáticas 

Calificación 

alta 

Calificación 

intermedia 

Calificación 

baja 

Física 

Calificación alta 

56 

71 

12 

Calificación Intermedia 

47 

163 

38 

Calificación baja 

14 

42 

85 


12.42 En la tabla 12.27 se muestran los resultados de una encuesta realizada con objeto de determinar si la edad de un conductor 
de 21 años o más tiene alguna relación con la cantidad de accidentes automovilísticos en los que se ve implicado (inclu¬ 
yendo accidentes menores). AI nivel de significancia: a) 0.05 y b ) 0.01, probar la hipótesis de que la cantidad de accidentes 
es independiente de la edad del conductor. ¿Cuáles pueden ser las fuentes de dificultad en la técnica de muestreo, así como 
otras consideraciones, que puedan afectar los resultados? 


Tabla 12.27 



Edad del conductor 

21-30 

31-40 

41-50 

51-60 

61-70 

Número de 
accidentes 

0 

748 

821 

786 

720 

672 

1 

74 

60 

51 

66 

50 

2 

31 

25 

22 

16 

15 

>2 

9 

10 

6 

5 

7 


12.43 a) Probar que x 2 = 12 - N P ara todas las tablas de contingencia, donde N es la frecuencia total de todas las 

celdas. 

b ) Resolver el problema 12.41 empleando los resultados de a). 


12.44 Si N¡ y N¡ denotan, respectivamente, la suma de las frecuencias en el renglón i y en la columna/ de una tabla de contingen¬ 
cia (las frecuencias marginales ), demostrar que la frecuencia esperada en la celda del renglón i y la columna j es N¡N¡/N, 
donde N es la frecuencia total de todas las celdas. 


12.45 Probar la fórmula (9) de este capítulo. ( Sugerencia: Utilizar los problemas 12.43 y 12.44.) 


12.46 Extender la fórmula (9) de este capítulo a tablas de contingencia 2 x k, donde k > 3. 
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12.47 Probar la fórmula (8) de este capítulo. 

12.48 Por analogía con las ¡deas desarrolladas para tablas de contingencia h x k, analizar las tablas de contingencia h x k x 1, 
indicando sus posibles aplicaciones. 

COEFICIENTE DE CONTINGENCIA 

12.49 En la tabla 12.28 se muestra la relación entre color de pelo y color de ojos encontrada en una muestra de 200 estudiantes. 

a) Encontrar el coeficiente de contingencia sin corrección de Yates y con ella. 

b ) Comparar el resultado dea) con el coeficiente máximo de contingencia. 


Tabla 12.28 



Color de pelo 

Rublo 

No rublo 

Color de ojos 

Azules 

49 

25 

No azules 

30 

96 


12.50 Encontrar el coeficiente de contingencia correspondiente a los datos: a) del problema 12.36 y ó) del problema 12.38, con 
corrección de Yates y sin ella. 

12.51 Encontrar el coeficiente de contingencia correspondiente a los datos del problema 12.41. 

12.52 Probar que el coeficiente máximo de contingencia de una tabla 3 x 3 es = 0.8165, aproximadamente. 

12.53 Probar que el coeficiente máximo de contingencia de una tabla k x k es sj(k - 1 )/k. 

CORRELACIÓN DE ATRIBUTOS 

12.54 Encontrar el coeficiente de correlación de los datos de la tabla 12.28. 

12.55 Encontrar el coeficiente de correlación de los datos: a) de la tabla 12.22 y b) de la tabla 12.23, con corrección de Yates y 
sin ella. 

12.56 Encontrar el coeficiente de correlación entre las calificaciones de matemáticas y de física de la tabla 12.26. 

12.57 Si C es el coeficiente de contingencia de una tabla k x k y r es el coeficiente de correlación correspondiente, probar que 

,• = C/V(l-C 2 )(k-1). 

PROPIEDAD ADITIVA DE x 2 

12.58 Para probar una hipótesis H 0 , se repite un experimento cinco veces. Los valores obtenidos para x 2 , correspondiente cada 
uno a 4 grados de libertad, son 8.3, 9.1, 8.9, 7.8 y 8.6. M ostrar que aunque al nivel de significancia 0.05 no se puede recha¬ 
zar H 0 con base en ninguno de los experimentos por separado, sí se puede rechazar a este nivel de significancia con base 
en todos los experimentos juntos. 














Ajuste de curvas 

Y MÉTODO DE 

MÍNIMOS 

CUADRADOS 



RELACIÓN ENTRE VARIABLES 

Con frecuencia, en la práctica se encuentra que existen relaciones entre dos (o más) variables. Por ejemplo, el peso de 
los hombres adultos depende de alguna manera de su estatura; la circunferencia de un círculo depende de su radio, y 
la presión de una masa de gas depende de su temperatura y volumen. 

Es útil expresar estas relaciones en forma matemática mediante una ecuación que conecte estas variables. 


AJUSTE DE CURVAS 

Para hallar una ecuación que relacione las variables, el primer paso es obtener datos que muestren los valores de las 
variables que se están considerando. Por ejemplo, si X y Y denotan, respectivamente, la estatura y el peso de hombres 
adultos, entonces en una muestra de N Individuos se hallan las estaturasX 1( X 2 ,..., X N y los correspondientes pesos Y 1( 

. Y n - 

El paso siguiente es graficar los puntos (X 1( YJ, (X 2 , Y 2 ),..., (X w , Y w ) en un sistema de coordenadas rectangulares. 
Al conjunto de puntos obtenido se le llama diagrama de dispersión. 

En el diagrama de dispersión es posible visualizar alguna curva cuya forma se aproxime a los datos. A esta curva 
se le llama curva de aproximación. Por ejemplo, en la figura 13-1 los datos al parecer se aproximan adecuadamente 
mediante una línea recta; entonces se dice que entre las variables existe una relación lineal. En cambio, en la figura 
13-2, aunque existe una relación entre las variables, esta relación no es una relación lineal y por lo tanto se le llama 
relación no lineal. 

En general, al problema de hallar la ecuación de una curva de aproximación que se ajuste a un conjunto dado de 
datos se le conoce como ajuste de curvas. 
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Diagrama de dispersión de pesos contra estaturas 



Figura 13-1 Algunas veces la relación entredós variables se describe mediante una línea recta. 


Diagrama de dispersión de número presente contra tiempo 



Tiempo 

Figura 13-2 Algunas veces la relación entredós variables se describe mediante una relación no lineal. 


ECUACIONES DE CURVAS DE APROXIMACIÓN 

Como referencia, a continuación se presentan varios de los tipos más comunes de curvas de aproximación. Todas las 
letras, excepto X y Y, representan constantes. A las variables X y Y se les llama variable independiente y variable 
dependiente, respectivamente, aunque estos papeles pueden intercambiarse. 


Línea recta 

Y — üq -b ü\X 

(1) 

Parábola o curva cuadrática 

Y = üq -\- ü\X -b ü2X^ 

(2) 

Curva cúbica 

Y = üq -\- ü\X -\- Ü2X + ci^X 

(3) 

Curva cuártica 

Y — üq Ü\X -\- Ü2X Ü3X ~b Ü\X 

(4) 

Curva degrado n 

Y = üq ~b ü\X ~b Ü2X^ ~b • • • ~b ü n X 

(5) 
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En las ecuaciones anteriores, a las expresiones de los lados derechos se les conoce como polinomios de primero, 
segundo, tercero, cuarto y n-ésimo grados, respectivamente. Las funciones definidas por las primeras cuatro ecuacio¬ 
nes se llaman funciones lineales, cuadráticas, cúbicas y cuárticas, en ese orden. 

Las siguientes son algunas de las muchas otras funciones que se emplean en la práctica: 

Hipérbola 

Y = — Y— oblen cL = ao + a¡X 
üq ci\ X Y 

(6) 

Curva exponencial 

Y = ab x oblen log Y = log a + (log b)X = a 0 + a : X 

(7) 

Curva geométrica 

Y = aX b oblen log Y = log a + b(log X) 

(8) 

Curva exponencial modificada 

Y = ab x + g 

(9) 

Curva geométrica modificada 

Y = aX b + g 

(10) 

Curva deGompertz 

Y = pq bX oblen log Y = log p + ¿> x (log q) = ab x + g 

(11) 

Curva deGompertz modificada 

Y = pq bX + h 

(12) 

Curva logística 

Y = —ry- — oblen \- = ab x +g 
ab x +g Y 

(13) 


Y — cíq ~\~ ci\ (log X ) + ^2 (log X ) 

(14) 


Para saber cuál de estas curvas emplear, es útil obtener el diagrama de dispersión de las variables transformadas. 
Por ejemplo, si el diagrama de dispersión de log Y contra X muestra una relación lineal, la ecuación será de la forma 
(7), en tanto que si log Y contra log X muestra una relación lineal, la ecuación será de la forma (8). Como ayuda para 
saber qué tipo de curva utilizar suele emplearse papel especial para graficar. AI papel para graficar en el que una de 
las escalas está calibrada logarítmicamente se le conoce como papel semilogarítmico, y al papel en el que las dos 
escalas están calibradas de manera logarítmica se le conoce como papel logarítmico. 

MÉTODO DE AJUSTE DE CURVASAMANO 

Para trazar una curva de aproximación que se ajusté a los datos puede emplearse el criterio personal. A este método se 
le llama ajuste de curva a mano. SI se sabe cuál es el tipo de ecuación, las constantes de la ecuación se determinan 
eligiendo tantos puntos de la curva como constantes tenga la ecuación. Por ejemplo, si la curva es una línea recta, se 
necesitarán dos puntos; si es una parábola, se necesitarán tres puntos. Este método tiene la desventaja de que personas 
distintas encontrarán curvas y ecuaciones distintas. 


LA LÍNEA RECTA 


El tipo más sencillo de curva de aproximación es una línea recta, cuya ecuación puede escribirse como 

Y = a 0 + a x X (15) 

Dados dos puntos cualesquiera (X 1; Y^) y (X 2 , Y 2 ) déla recta, se determinan las constantes a 0 y La ecuación que se 
obtiene es 

Y- Yi= oblen Y -Y, = m(X - X,) (16) 


donde 


m = 


Y2 - Y, 
X 2 -X x 


es la pendiente de la recta y representa el cambio o variación en Y dividido por un cambio o variación correspondien¬ 
te enX. 
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En la ecuación escrita de la forma (15), la constante a 2 es la pendiente m. La constante a 0 , que es el valor de Y 
cuando X = 0, se conoce como la intersección con el eje Y. 

EL MÉTODO DE MÍNIMOS CUADRADOS 

Para evitar el empleo del criterio personal para la construcción de rectas, parábolas u otras curvas de aproximación que 
se ajusten a un conjunto de datos, es necesario ponerse de acuerdo en una definición de la "recta de mejor ajuste", la 
"parábola de mejor ajuste", etcétera. 

Con objeto dedar una definición, considérese la figura 13-3, en la que los datos son los puntos (X 1; YJ, (X 2 , Y 2 ),..., 
(X N , Y n ). Dado un valor deX, por ejemplo X 2 , entre el valor Y 2 y el valor correspondiente determinado de acuerdo con 
la curva C habrá una diferencia.Como se muestra en la figura, esta diferencia se denota D 2 y se llama la desviación, el 
error o el residual y puede ser positivo, negativo o cero. De manera semejante se obtienen lasdesviacionesX 2 ,...,X N 
correspondientes a cada valor D 2 . D N . 

Una medida déla "bondad de ajuste" de la curva C a los datos dados es la cantidad D\ + d\ h -b D 2 N . SI esta 

cantidad es pequeña, el ajuste es bueno; si es grande, el ajuste es malo. De esta manera se llega a la definición 
siguiente: 


Definición: De todas las curvas que se aproximan a un conjunto dado de puntos, a la curva que ti ene 
la propiedad deque d\ + Dj-\ - v D 2 N sea la mínima se le llama curva de mejor ajuste. 

Una curva que ti ene esta propiedad se dice que se ajusta a los datos en el sentido de mínimos cuadrados y se le llama 
curva de mínimos cuadrados. De manera que una recta que tiene esta propiedad se dice que es una recta de mínimos 
cuadrados, una parábola que tiene esta propiedad es una parábola de mínimos cuadrados, etcétera. 

La definición anterior suele emplearse cuando X es la variable Independiente y Y es la variable dependiente. SI X 
es la variable dependiente, la definición se modifica considerando desviaciones horizontales en lugar de desviaciones 
verticales, lo que equivale a Intercambiar losejesX y Y. Por lo general, estas dos definiciones llevan a curvas distintas 
de mínimos cuadrados. En este libro, a menos que se especifique otra cosa, se considerará queX es la variable Inde¬ 
pendiente y que Y es la variable dependiente. 

También pueden definirse otras curvas de míni mos cuadrados considerando las distancias perpendiculares del punto 
a la curva en lugar de las distancias verticales u horizontales. Sin embargo, esto no suele usarse. 


Curva de mejor ajuste 



Xj X 2 X 3 X n 

Figura 13-3 D x es la distancia del punto (X lf Y x ) a la curva de mejor ajuste,..., D„ 
es la distancia del punto (X„, Y n ) a la curva de mejor ajuste. 


LARECTADE M ÍNIMOS CUADRADOS 


La recta de mínimos cuadrados que aproxima el conjunto de puntos (X x , Y : ), (X 2 , Y 2 ).(X w , Y w ) tiene la ecuación 

Y = a 0 + a 1 X (17) 
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donde las constantes a 0 y a 2 se determinan resolviendo las ecuaciones simultáneas 

E Y = a 0 N +a l J2 x 

E XY = ao E X + ai E U8) 

a las que se les denomina ecuaciones normales de la recta de mínimos cuadrados (17). Las constantes a 0 y a x de las 
ecuaciones (18) pueden hallarse empleando las fórmulas 

„ (E JO(E x2 ) - (E ^)(E xy) „ tfE*r-(E*)(En 

do =---ó- Q\ =---o- U j ) 

N E ^ - (E x ) 2 N E - (E X) 2 

Para recordar las ecuaciones normales (18) hay que observar que la primera ecuación se obtiene formalmente 
sumando a ambos lados de la ecuación (17) [es decir, E Y = E( fl o + «i^) = a 0 N + a x E AL] y la segunda ecuación 
se obtiene multiplicando, primero, ambos lados de la ecuación (17) por X y después sumando [es decir, E XY = 
E x (a 0 + a x X) = a 0 E x + «i E x2 \■ Obsérvese que no se trata de una deducción de las ecuaciones normales, 
sino simplemente de una manera que facilita recordarlas. Obsérvese también que en las ecuaciones (18) y (19) se ha 
empleado la notación abreviada EX, E Y ' etc., en lü 9 ar de E ; =i x r E,-i x j Y j> etcétera. 

El trabajo que implica hallar la recta de mínimos cuadrados puede reducirse transformando los datos de manera 
que a- = X - Xy y = Y - Y. Entonces, la ecuación de la recta de mínimos cuadrados puede escribirse de la manera 
siguiente (problema 13.15): 

j= (e?)* obien j= (e?) x (20) 

En particular, si X es tal queE x = O (es decir, X = 0), la ecuación se convierte en 

7 =?+ (e?)^ (2I) 

La ecuación (20) implica que y = 0 parax = 0; por lo tanto, la recta de mínimos cuadrados pasa por el punto (X,Y), 
al que se le llama el centroide o centro de gravedad de los datos. 

SI se considera que la variableX es la variable dependiente en lugar de la variable independiente, la ecuación (17) 
seescribeX = b 0 + b 1 Y. Las fórmulas anteriores también son válidas cuando se Intercambian X y Y, y a 0 y a 1 se sus¬ 
tituyen por b 0 y b x , respectivamente. Sin embargo, por lo general la recta de mínimos cuadrados que se obtiene no es 
la misma que la que se obtuvo antes [ver problemas 13.11 y 13.15d)]. 

RELACIONES NO LINEALES 

Algunas veces, las relaciones no lineales pueden reducirse a relaciones lineales mediante transformaciones adecuadas 
de las variables (ver problema 13.21). 

LAPARÁBOLADE M INI M OS C UADRADOS 

La parábola de mínimos cuadrados que aproxima el conjunto de puntos (X 1; Y^, (X 2 , Y 2 ),...,(X N , Y w ) tiene la ecua¬ 
ción 

Y = ct 0 + a x X + a 2 X 2 (22) 

donde las constantes a 0 , a x y a 2 se determinan resolviendo simultáneamente las ecuaciones 

E Y = a o x + fl i E ^ + a 2 E x 

E XY = ciq e x + ü\ E x~ + ü -2 E x3 

E x y = «o E x + Cl i E x ^ + a 2 E -Y 4 

llamadas ecuaciones normales de la parábola de mínimos cuadrados (22). 


( 23 ) 
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Para recordar las ecuaciones (23), obsérvese que se pueden obtener formalmente multiplicando la ecuación (22) 
por 1, X y X 2 , respectivamente, y sumando a ambos lados de las ecuaciones resultantes. Esta técnica puede extenderse 
a las ecuaciones normales de curvas cúbicas de mínimos cuadrados, ecuaciones cuárticas de mínimos cuadrados y, en 
general, a cualquiera de las curvas de mínimos cuadrados correspondientes a la ecuación (5). 

Como en el caso déla recta de mínimos cuadrados, las ecuaciones (23) se simplifican si lasX se escogen de mane¬ 
ra queE X = 0. Estas ecuaciones también se simplifican empleando las nuevas variables * = X - Xy y=Y - Y. 


REGRESIÓN 

Con frecuencia se desea estimar el valor de la variable Y que corresponde a un valor dado de Ia variable X, basándose 
en los datos muéstrales. Esto se hace estimando el valor de Y a partir de la curva de mínimos cuadrados ajustada a los 
datos muéstrales. A la curva de mínimos cuadrados se le llama curva de regresión de Y enX, debido a que Y se estima 
a partir deX. 

Silo que se desea es estimar un valor de X a partir de un valor dado de Y, se emplea la curva de regresión deX en 
Y, que es lo mismo que Intercambiar las variables en el diagrama de dispersión, de manera queX sea la variable depen¬ 
diente y Y sea la variable independiente. En este caso se sustituyen las desviaciones verticales, de la definición de la 
curva de mínimos cuadrados de la página 284, por desviaciones horizontales. 

En general, la recta o la curva de regresión de Y enX no es igual a la recta o a la curva de regresión deX en Y. 


APLIC ACIONES A SERIES DE TIEMPO 

Si la variable IndependlenteX representa tiempo, los datos dan el valor de Y en distintos momentos. A los datos orde¬ 
nados de acuerdo con el tiempo se les llama serie de tiempo. En este caso, a la recta o a la curva de regresión de Y en 
X se le llama recta o curva de tendencia y se emplea para hacer estimaciones, predicciones o pronósticos. 


PROBLEMASEN LOSQUE INTERVIENEN MÁS DE DOS VARIABLES 

Los problemas en los que intervienen más de dos variables se tratan de manera análoga a los problemas de dos varia¬ 
bles. Por ejemplo, entre lastres variables X, Y y Z puede haber una relación que pueda ser descrita mediante la ecua¬ 
ción 


X — ¿íq -(- ci\X q 2 Y (24) 

a la que se le llama ecuación lineal en las variables X, Y y Z. 

E n un sistema de coordenadas rectangulares, esta ecuación representa un plano y los puntos muéstrales (X 1; Y 1; Z{), 
(X 2 , Y 2 , Z 2 ),..., (X N , Y n ,Z n ) estarán "dispersos" no demasiado lejos de este plano, al que se le llama plano de aproxi¬ 
mación. 

Por extensión del método de mínl mos cuadrados, se puede hablar de un plano de mínimos cuadrados que se aproxi¬ 
me a los datos. Si Z se aproxima a partir de los valores deX y Y, a este plano se le llamará plano de regresión deZ en 
X y Y. Las ecuaciones normales correspondientes al plano de mínimos cuadrados (24) son 

E ^ =a 0 N + a, E * + «2 E Y 

xz=a 0 ¿: x+ ai ¿: X 2 + a 2 E XY 

E TZ = a„E Y + ai ¿2 XY + a 2 ¿2 Y 2 (25) 

y para recordarlas se puede pensar que se obtienen a partir de la ecuación (24) multiplicando ésta por 1,X y Y y suman¬ 
do después. 
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También se pueden considerar ecuaciones más complicadas que la (24). Éstas representan superficies de regresión. 
Cuando el número de variables es mayor a tres, se pierde la intuición geométrica debido a que se requieren espacios 
de cuatro, cinco o n dimensiones. 

A los problemas en los que se estima una variable a partir dedos o más variables se les llama problemas deregre- 
sión múltiple. Estos problemas serán considerados más detalladamente en el capítulo 15. 


PROBLEMAS RESUELTOS 


LÍNEAS RECTAS 

13.1 Treinta estudiantes de secundaria fueron entrevistados en un estudio acerca de la relación entre el tiempo que 
pasan en Internet y su promedio de calificaciones. Los resultados se muestran en la tabla 13.1. X es la cantidad 
de tiempo que pasan en Internet y Y es su promedio de calificaciones. 


Tabla 13.1 


Horas 

Promedio 

Horas 

Promedio 

Horas 

Promedio 

11 

2.84 

9 

2.85 

25 

1.85 

5 

3.20 

5 

3.35 

6 

3.14 

22 

2.18 

14 

2.60 

9 

2.96 

23 

2.12 

18 

2.35 

20 

2.30 

20 

2.55 

6 

3.14 

14 

2.66 

20 

2.24 

9 

3.05 

19 

2.36 

10 

2.90 

24 

2.06 

21 

2.24 

19 

2.36 

25 

2.00 

7 

3.08 

15 

2.60 

12 

2.78 

11 

2.84 

18 

2.42 

6 

2.90 

20 

2.45 


Usar M INITAB para: 

a) Hacer un diagrama de dispersión con estos datos. 

b) Ajustar una recta a estos datos y dar los valores dea 0 y a v 

SOLUCIÓN 

a) En las columnas C1 y C2 de la hoja de cálculo de M INITAB se ingresan estos datos. La columna C1 se titula Ho r a s 
en I nternet y la columna C 2 Pro me di o de cal if¡ c a c i ones. Empleando la secuencia Stat -> Regresión —> 
Regression se obtienen los resultados que se muestran en la figura 13-4. 

b ) El valor dea 0 es 3.49 y el valor dea : es -0.0594. 

13.2 Resolver el problema 13.1 usando EXCEL. 

SOLUCIÓN 

En las columnas A y B de la hoja de cálculo de EXCEL se Ingresan los datos. Con la secuencia Tools-> Data Análisis 
Regression se obtiene el cuadro de diálogo de la figura 13-5 que se llena como ahí se muestra. La parte de interés del 
resultado, en este momento, es 


Intersección 
Horas en Internet 


3.488753 

-0.05935 
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Diagrama de dispersión de promedio VS. horas en Internet 



Figura 13-4 La suma de los cuadrados de las distancias de los puntos a la recta de mejor 
ajuste es la mínima utilizando la recta promedio = 3.49 - 0.0594 llorasen Internet. 


/ \ 



Figura 13-5 EXCEL, cuadro de diálogo para el problema 13.2. 


A la constante a 0 se le llama intersección y a la constante a : se le denomina pendiente. Se obtienen los mismos 
valores que con M INITAB. 

a) M ostrar que la ecuación de la recta que pasa a través de los puntos (X 1; V^) y (X 2 , Y 2 ) está dada por 

Y-, - Y, 


13.3 
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b) Encontrar la ecuación de la recta que pasa a través de los puntos (2, -3) y (4, 5). 

SOLUCIÓN 


La ecuación de la recta es 

Y — a 0 + a 2 X 


(29) 

Como (X lr y 2 ) está en la recta, 

Yi = a 0 + a 1 X 1 


(30) 

Como (X 2 , y 2 ) está en la recta, 

^2 = a 0 + a l'^2 


(31) 

Sustrayendo la ecuación (30) de la ecuación (29), 




y_y 1 = a l( X_ Xl ) 


(32) 

Sustrayendo la ecuación (30) de la ecuación (31), 

Y 2 - Y¡ = a¡(X 2 - X¡) o bien 

Sustituyendo este valor dea 2 en la ecuación (32), se obtiene 

II 

1 



Yn - Y, 

Y - Y, =— -— (X-X,) 

1 x 2 -x, u 


como se deseaba. La cantidad 


Y 2 ~ Y, 

*2-Y, 


se abrevia m, representa el cambio en Y dividido entre el correspondiente cambio en X y es la pendiente de la recta. La 
ecuación buscada es Y - Y x = m(X - Xj). 
b ) Primer método [empleando los resultados del Inciso a)] 

En el primer punto (2, -3) setleneXj = 2 y Yj = -3; en el segundo punto (4, 5) setleneX 2 = 4 y y 2 = 5. Por 
lo tanto, la pendiente es 


Y2 Y\ 


X 2 -Xi 


5 ( 3 ) 8 , 

4-2 2 


y la ecuación buscada es 


Y-Y l = m(X-X l ) o bien Y - (-3) = 4(X - 2) 

la cual se puede escribir como / + 3 = 4(X - 2), o bien Y = 4X - 11. 

Segundo método 

La ecuación de una línea recta es Y = a 0 + a 2 X. Como el punto (2, -3) pertenece a esta recta, -3 = a 0 + 2a v 
y como también el punto (4, 5) pertenece a esta recta, 5 = a 0 + 4a x ; resolviendo estas dos ecuaciones simultáneas, se 
obtiene a x = 4 y a 0 = -11. Por lo tanto, la ecuación buscada es 

Y = - 11 + 4X o bien Y = 4X - 11 


13.4 Se siembra trigo en 9 parcelas del mismo tamaño. En la tabla 13.2 se muestran las cantidades de fertilizante 
empleadas en cada parcela, así como las cantidades de trigo obtenidas. 

Usar M INITAB para ajustar una curva parabólica Y = a 0 + a : X + a 2 X 2 a estos datos. 
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Tabla 13.2 


Cantidad de trigo (y) 

Fertilizante (x) 

2.4 

1.2 

3.4 

2.3 

4.4 

3.3 

5.1 

4.1 

5.5 

4.8 

5.2 

5.0 

4.9 

5.5 

4.4 

6.1 

3.9 

6.9 


SOLUCIÓN 

Las cantidades de trigo se ingresan en la columna C1 y las de fertilizante en la columna C2. Con la secuencia Stat 
Regresión —> Fltted Une Plotse obtiene el cuadro de diálogo que se muestra en la figura 13-6. 



Figura 13-6 MINITAB, cuadro dediálogo para el problema 13.4. 

Con este cuadro de diálogo se obtiene el resultado que se muestra en la figura 13-7. 


Gráfica de la línea ajustada 
Y =-0.2009 +2.266 X 
-0.2421 X*^ 



Figura 13-7 M INITAB, ajuste de la curva parabólica de mínimos cuadrados a un conjunto de datos. 
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13.5 Encontrar: a) la pendiente, b) la ecuación, c) la intersección con el eje y y d) la Intersección con el ejeX de la 
recta que pasa por los puntos (1, 5) y (4, -1). 

SOLUCIÓN 

a) (Xj s 1, Y 1 m 5) y (X 2 = 4, y 2 = -1). Por lo tanto, 

Y 2 -Y¡ -1-5 -6 

-"‘•“o;—= t=- ! 

El signo negativo de la pendiente indica que a medida queX crece, Y decrece, como se muestra en la figura 13-8. 

b ) La ecuación de la recta es 


y-y 1 = m(X-x 1 ) o y-5 = -2(x-i) 

Es decir, y - 5 =-2X + 2 o Y = 7-2X 

Esta ecuación también se puede obtener empleando el segundo método del problema 13.3b). 

c) La intersección con el eje Y, que es el valor de y cuando X = 0, es Y = 7 - 2(0) = 7. Esto también puede verse direc¬ 
tamente en la figura 13-8. 



Figura 13-8 Recta quemuestra la intersección con el ejeX y la intersección con el eje/. 


d ) La intersección con el ejeX es el valor deX cuando y = 0. Sustituyendo y = 0 en la ecuación y = 7 - 2X, se tiene 

0 = 7-2X,o2X = 7yX = 3.5. Esto también se puede ver directamente en la figura 13-8. 

13.6 Encontrar la ecuación de la recta que pasa a través del punto (4, 2) y que es paralela a la recta 2X + 3y = 6. 

SOLUCIÓN 

Si dos rectas son paralelas, sus pendientes son iguales. De 2X + 3y = 6 se obtiene 3y = 6 - 2X, o bien y = 2 - |X, de 

manera que la pendiente de la recta es m = -§. Por lo tanto, la ecuación de la recta que se busca es 

y - y llg m(X -x x ) o y — 2 = —|(x — 4) 

la cual también se puede escribir como 2X + 3y = 14. 
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Otro método 

La ecuación de cualquier recta paralela a 2X + 37 = 6 es de la forma 2X + 37 = c. Para encontrar c, seaX = 4 y 
Y = 2. Entonces 2(4) + 3(2) = c, o c = 14, con lo que la ecuación buscada es 2X + 3 Y = 14. 

13.7 Encontrar la ecuación de la recta cuya pendiente es -4 y cuya intersección con el eje y es 16. 

SOLUCIÓN 

En la ecuación Y = a 0 + a : X, a 0 = 16 es la intersección con el eje Y y a x = -4 es la pendiente. Por lo tanto, la ecuación 
buscada es Y = 16 - 4X. 

13.8 a) Construir una recta que se aproxime a los datos déla tabla 13.3. 
b) Encontrar la ecuación de esta recta. 


Tabla 13.3 


X 

1 

3 

4 

6 

8 

9 

11 

14 

Y 

1 

2 

4 

4 

5 

7 

8 

9 


SOLUCIÓN 

a) En un sistema de coordenadas rectangulares segrafican los puntos (1,1), (3, 2), (4, 4), (6, 4), (8, 5), (9, 7), (11, 8) y 
(14, 9), como se muestra en la figura 13-9. En la figura se ha trazado a mano una recta que se aproxima a los datos. 
En el problema 13.11 se muestra un método que elimina el criterio personal; ese método es el de mínimos cuadra¬ 
dos. 



x 

Figura 13-9 Método a mano para el ajuste de curvas. 

b ) Para obtener la ecuación de la recta construida en el inciso a), se eligen cualesquiera dos puntos de la recta, por ejem¬ 

plo, P y 0; como se muestra en la gráfica, las coordenadas délos puntos P y Q son aproximadamente (0,1) y (12, 7.5). 
La ecuación de una recta es Y = a 0 + ajX. Por lo tanto, para el punto (0,1) se tiene 1 = a 0 + a^O), y para el punto 
(12, 7.5) se tiene 7.5 = a 0 + 123^ como de la primera de estas ecuaciones se obtiene a 0 = 1, de la segunda se obtiene 
a L = 6.5/12 = 0.542. Entonces, la ecuación buscada es Y = 1 + 0.542X. 

Otro método 


y-y> y y - I=^ r |(^- 0) = 0 . 542 X 


Por lo tanto, Y = 1 + 0.542X. 
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13.9 a) Comparar los valores de Y obtenidos a partir de la recta de aproximación con los datos de la tabla 13.2. 

b) Estimar el valor de Y para X = 10. 

SOLUCIÓN 

a) ParaX = 1, Y = 1 + 0.542(1) = 1.542, o bien 1.5. ParaX = 3, Y = 1 + 0.542(3) = 2.626 o bien 2.6. De la misma 
manera se obtienen valores de Y correspondientes a otros valores deX. Los valores estimados para Y a partir de la 
ecuación Y = 1 + 0.542X se denotan Y est . En la tabla 13.4 se presentan estos valores estimados junto con los datos 
originales. 

b) El valor estimado de Y correspondiente aX = 10 es Y = 1 + 0.542(10) = 6.42 o 6.4. 


Tabla 13.4 


X 

1 

3 

4 

6 

8 

9 

11 

14 

Y 

1 

2 

4 

4 

5 

7 

8 

9 

^est 

1.5 

2.6 

3.2 

4.3 

5.3 

5.9 

7.0 

8.6 


13.10 En la tabla 13.5 se presentan las estaturas en pulgadas (¡n) y los pesos en libras (Ib) de 12 estudiantes varones 
que forman una muestra aleatoria de los estudiantes de primer año de una universidad. 


Tabla 13.5 


EstaturaX (in) 

70 

63 

72 

60 

66 

70 

74 

65 

62 

67 

65 

68 

Peso Y (Ib) 

155 

150 

180 

135 

156 

168 

178 

160 

132 

145 

139 

152 


a) Obtener el diagrama de dispersión de estos datos. 

b) Trazar una recta que se aproxime a los datos. 

c) Encontrar la ecuación déla recta que se trazó en el Inciso b). 

d) Estimar el peso de un estudiante cuya estatura es 63 ¡n. 

e) Estimar la estatura de un estudiante cuyo peso es 168 Ib. 

SOLUCIÓN 

a) El diagrama de dispersión que se muestra en la figura 13-10 se obtiene graficando los puntos (70,155), (63,150),..., 
(68,152). 

b ) En la figura 13-10 se presenta una recta que se aproxima a los datos. Pero ésta es sólo una de las muchas que podían 
haberse trazado. 

c) Se toman dos puntos cualesquiera de la recta construida en el inciso b), por ejemplo P y Q. Las coordenadas de estos 
puntos, de acuerdo con la gráfica, son aproximadamente (60,130) y (72,170). Por lo tanto, 


Y - 


Y, = 


Y 2 - Y i 

x 2 -x, 


(JY-Xi) 


Y - 


130 = 


170-130 

72-60 


(X - 60) 



X- 70 


d) Si X = 63, entonces Y = ^(63) - 10 = 140 Ib. 

e) Si Y = 168, entonces 168 = f X - 70, f X = 238 y X = 71.4 o bien 71 in. 











Problemas resueltos 329 



LARECTADE M ÍNIMOS CUADRADOS 

13.11 E ncontrar la recta de mínimos cuadrados correspondiente a los datos del problema 13.8 empleando: a) X como 
variable Independiente y b) X como variable dependiente. 

SOLUCIÓN 

a) La ecuación de una recta es Y = a 0 + a x X. Las ecuaciones normales son 

E Y = a 0 N + tf| E ^ 

Eir = aoE^+“i E * 2 

El cálculo de estas sumas se puede organizar como se muestra en la tabla 13.6. Aunque la última columna de la 
derecha no se necesita en esta parte del problema, se ha incluido en la tabla para emplearla en el inciso b ). 

Como hay ocho pares de valoresX y Y, N = 8 y las ecuaciones normales resultan ser 

8a 0 4- 56(7! = 40 
56 a 0 4- 524ai = 364 

Resolviendo simultáneamente estas ecuaciones, se obtiene a 0 = £ o 0.545; a¡ = ^ o 0.636; con lo que la recta de 
mínimos cuadrados buscada es Y = ^ + ^I, o Y = 0.545 + 0.636X. 


Tabla 13.6 


X 

Y 

X 2 

XY 

y 2 

1 

1 

1 

1 

1 

3 

2 

9 

6 

4 

4 

4 

16 

16 

16 

6 

4 

36 

24 

16 

8 

5 

64 

40 

25 

9 

7 

81 

63 

49 

11 

8 

121 

88 

64 

14 

9 

196 

126 

81 

EX=56 

M 

-< 

II 

-P* 

O 

EX 2 = 524 

EXT = 364 

E/ 2 = 256 
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b ) 


Otro método 


(E n(E - (E A-)(E *Y) _ (40)(524) - (56)(364) 
N E - (E Y ) 2 (8)(524) - (56) 2 

N E XY - (E *)(E Y) (8)(364) — (56)(40) 7 

ÍVE^-ÍE xf (8) (524) - (56) 2 11 


6 

“ U 

o bien 

o bien 

0.636 


0.545 


Por lo tanto, y = a 0 + a x X, o bien Y = 0.545 + 0.636X, como antes. 

Si X es considerada como la variable dependiente, entonces Y es la variable independiente; la ecuación de la recta de 
mínimos cuadrados esX = Jb 0 + b{f y las ecuaciones normales son 


E X =b 0 N +¿,E^ 


E XY = b 0 E Y + b l £ Y 2 

Entonces, de acuerdo con la tabla 13.6, las ecuaciones normales son 

8 b 0 + 406! = 56 


40b o + 256 bi = 364 

de donde b 0 = -( o bien -0.50 y b x = |o bien 1.50. Estos valores también pueden obtenerse de la manera siguiente 

b (E AQ(E Y 2 ) - (E r)(E XY) (S 6 )( 2 S 6 ) - (40)(364) g() 

0 N E Y 2 - (E Í0 2 (8)(256) - (40) 2 

b _ NJ2XY-(J2 X)(J2 y) _ (8)(364) - (56)(40) _ 15Q 
1 ÍVE^-fE Y) 2 (8)(256) - (40) 2 

Por lo tanto, la ecuación buscada de la recta de mínimos cuadrados esX = b 0 + b x Y o bien X = -0.50 + 1.50y. 

Obsérvese que despejando Y de esta ecuación se obtiene Y = \ + \x o bien Y = 0.333 + 0.667X, que no es 
Igual a la recta obtenida en el inciso a). 


13.12 Emplear el paquete para estadística SAS para trazar, en una misma gráfica, los puntos correspondientes a los 
datos de estatura y peso del problema 13.10 y la recta de mínimos cuadrados. 

SOLUCIÓN 

En la figura 13-11, los puntos correspondientes a los datos se presentan como pequeños círculos vacíos y la recta de míni¬ 
mos cuadrados como una recta punteada. 


180 -r 


170 - 


160 - 


150 - 


140 - 


130 -. 



66 68 
Estatura 

Figura 13-11 SAS, gráfica que presenta los puntos correspondientes a los datos 
de la tabla 13.5 y la recta de mínimos cuadrados. 
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13.13 a) M uestre que las dos rectas de mínimos cuadrados obtenidas en el problema 13.11 se intersecan en el punto 

(X,Y). 

b) Estimar el valor de Y para X = 12. 

c) Estimar el valor deX para Y = 3. 

SOLUCIÓN 


£Jf = 56 y H Y 40 
N 8 N 8 


5 


Por lo tanto, el punto ( X , Y), llamado el centroide, es (7, 5). 

a) El punto (7, 5) se encuentra en la recta Y = 0.545 + 0.636X; o, más exactamente, Y = y¡ + j¡X, ya que 

5 = + -jj (7). EI punto (7, 5) se encuentra en la recta X = - \ + \ Y, ya que 7 = - \ +§ (5). 

Otro método 

Las ecuaciones de las dos rectas son Y = n + n^ y X = -\ + \Y. Resolviendo simultáneamente estas dos ecua¬ 
ciones se encuentra X = 7 y Y = 5. Por lo tanto, las rectas se intersecan en el punto (7, 5). 

b) Sustituyendo X = 12 en la recta de regresión de Y (problema 13.11), Y = 0.545 + 0.636(12) = 8.2. 

c) Sustituyendo Y = 3 en la recta de regresión deX (problema 13.11), X = -0.50 + 1.50(3) = 4.0. 


13.14 Probar que una recta de mínimos cuadrados siempre pasa por el punto (X,Y). 

SOLUCIÓN 

Caso 1 (X es la variable independiente) 

La ecuación de la recta de mínimos cuadrados es 

y = a 0 + a x X (34) 

U na de las ecuaciones normales de la recta de mínimos cuadrados es 

J2Y = a 0 N + aiJ2X 05) 

Dividiendo ambos lados de la ecuación (35) entre N se obtiene 

Y = a 0 + a¡X (36) 

Restando la ecuación (36) de la ecuación (34), la recta de mínimos cuadrados se puede escribir como 

Y-Y = ci x (X-X) (37) 

lo que muestra que la recta pasa a través del punto (X, Y). 

Caso 2 (7 es la variable independiente) 

Procediendo como en el caso 1, pero intercambiando X y y y sustituyendo las constantes a 0 y a : por b 0 y b v respec¬ 
tivamente, se encuentra que la recta de mínimos cuadrados puede escribirse como 

X-X=b x (Y-Y) (38) 

lo que indica que la recta pasa por el punto (X, Y). 

Obsérvese que las rectas (37) y (38) no coinciden, sino que se intersecan en (X, Y). 


13.15 a) Considerando X como la variable Independiente, mostrar que la ecuación déla recta de mínimos cuadrados 
se puede escribir como 


E 

E * 2 


y = ( x o bien y = 


E xY 
E * 2 


donde x = X - X y y = Y - Y. 
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b) Si X = 0, mostrar que la recta de mínimos cuadrados del inciso a) puede escribirse como 


Y=Y + 


,z* 2 ) 


X 


c) Dar la ecuación de la recta de mínimos cuadrados correspondiente a la del inciso a) en el caso en que Y 
sea la variable independiente. 

d) Verificar que las rectas de los incisos a) y c) no son necesariamente iguales. 


SOLUCIÓN 


a) La ecuación (37) puede escribirse como y = apr, donde x = X — X y y = Y - y. Además, resolviendo simultánea¬ 
mente las ecuaciones normales (18) se tiene 

3 N Z XY - (E X)(E y) N y (x + X)(y + 7) - K (* + *1E (y + El 
a ' NY,X 2 -{¿2 X) 2 N £ (x + X) 2 - E (x + X)] 2 

_ NJ2{xy + xY + Xy + XY)-(Y J x + NX){J2y + NY) 

NJ2{x 2 + 2xX + X 2 ) - (Y, x + NX) 2 
_ Nj2xy + NYJ2x + NXJ2y + N 2 X? - (^ x + NX)(Y y + NY) 

NJ2x 2 + 2NX Y x + N 2 X 2 - (Y x + NX) 1 

Pero Y x = Y {X - X) = 0 y Y y = E ( Y - Y) = 0; por lo que la fórmula anterior se simplifica a 

_NJ2 xy + N 2 XY - N 2 XY _ Y XV 
~ N Y X 2 + N 2 X 2 - N 2 X 2 - Y X 2 


Lo que puede escribirse como 


J2xy_Ex(Y- Y) _J2xY- ?£*_£ xY 


Z 


E 


E 


E 


Por lo tanto, la recta de mínimos cuadrados esy = apr; es decir, 


y = 


Evr 

E 


o bien 


y = 


(Zjy Y 

VE- 


b) Si X = 0, x = X - X = X. Entonces, de acuerdo con la fórmula 


se tiene 



y = 


( Z XY 
\ZX 2 


X 


o bien 


y = y + 


( Z xy - 
VZ * 2 


x 


Otro método 

Las ecuaciones normales de la recta de mínimos cuadrados Y = a 0 + a x X son 

Y Y = a 0 N + a,Y x y E^ = «oE^ + "iE^ 2 


Si X = (E X )/N = 0, entonces Y x = 0 y las ecuaciones normales se transforman en 

Z Y = a 0 N y Y XY = ai Z* 2 

y ^ Y - Y XY 

de donde flo = ^_ =y y fll = 

Por lo tanto, la ecuación buscada de la recta de mínimos cuadrados es 


Y — 3(¡ + 


o bien 


y = y + 


E XY 

Z xl 


x 
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c) I ntercambiando X y Y o bien x y y, se puede demostrar como en el inciso a) que 

^E 


x=1 e7’- v 

d) De acuerdo con el inciso a), la recta de mínimos cuadrados es 

'E xy 


y=[ E- ,x 


De acuerdo con el inciso c), la recta de mínimos cuadrados es 


(39) 


o bien 


(E *y 
\Ey 2 


y = 


E / 

E xy 


(40) 


y, 2 

C orno en general ± 1 

E * E 

en general las rectas de mínimos cuadrados (39) y (40) son diferentes. Sin embargo, obsérvese que estas rectas se 
intersecan en x = 0 y y = 0 [es decir, en el punto (X,Y)\. 


13.16 SiX' = X+ AyY' = Y + B, donde A y B son constantes cualesquiera, probar que 

fl .... N E XY- (E *)(E Y) _ N E X'Y' - (E -y')(E Y') _ 

ai N E ^r 2 - (E ^) 2 ne x ' 2 ~ (E ^') 2 a ‘ 

SOLUCIÓN 


x' = X' - X' = [X + A) - (X + Á) = X - X = x 
y' = y' - ?' = {Y + B) - (Y+ B) = Y - Y = y 


Entonces 


E xy _ E x'y' 

E -^ 2 E *' 2 


y el resultado es consecuencia del problema 13.15. U n resultado similar es válido para b 1 . 

Este resultado es útil, pues permite simplificar los cálculos para obtener la recta de regresión sustrayendo a las varia¬ 
bles X y Y constantes adecuadas (ver el segundo método del problema 13.17). 

Nota: Este resultado no es válido si X' = c L X -M y Y' = c 2 Y + B, a menos quecj = c 2 . 


13.17 Ajustar una recta de mínimos cuadrados a los datos del problema 13.10 empleando: a) X como la variable 
Independiente y b) X como variable dependiente. 


SOLUCIÓN 


Primer método 

a) De acuerdo con el problema 13.15a), la recta buscada es 


y 



X 


donde a- = X - X y y = Y - Y. Los cálculos de las sumas se pueden organizar como se muestra en la tabla 13.7. De 
acuerdo con las dos primeras columnas X = 802/12 = 66.8 y Y = 1 850/12 = 154.2. La última columna se incluyó 
para emplearla en el inciso b). 
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Tabla 13.7 


Estatura X 

Peso Y 

1 

II 

y= Y- Y 

xy 

X 2 

y 2 

70 

155 

3.2 

0.8 

2.56 

10.24 

0.64 

63 

150 

-3.8 

-4.2 

15.96 

14.44 

17.64 

72 

O 

co 

I—1 

5.2 

25.8 

134.16 

27.04 

665.64 

60 

135 

-6.8 

-19.2 

130.56 

46.24 

368.64 

66 

156 

-0.8 

1.8 

-1.44 

0.64 

3.24 

70 

168 

3.2 

13.8 

44.16 

10.24 

190.44 

74 

178 

7.2 

23.8 

171.36 

51.84 

566.44 

65 

160 

-1.8 

5.8 

-10.44 

3.24 

33.64 

62 

132 

-4.8 

-22.2 

106.56 

23.04 

492.84 

67 

145 

0.2 

-9.2 

-1.84 

0.04 

84.64 

65 

139 

-1.8 

-15.2 

27.36 

3.24 

231.04 

68 

152 

1.2 

-2.2 

-2.64 

1.44 

4.84 

E X = 802 
X = 66.8 

E Y = 1 850 
Y = 154.2 



E xy = 616.32 

E x 2 = 191.68 

E X 2 = 2 659.68 


La recta de mínimos cuadrados buscada es 


y = 


( Z -yy 
\Z * 2 


616.32 

191.68 


x = 3.22x 


o bien Y - 154.2 = 3.22(X - 66.8), lo que puede escribirse como Y = 3.22X - 60.9. A esta ecuación se le conoce 
como la recta de regresión de Y sobre X y sirve para estimar valores de Y a partir de valores dados deX. 
b ) Si X es la variable dependiente, la recta buscada es 


x = 


(Zw) 616.32 
VE Y 2 / 2 659.68 3 


0.232y 


la cual se puede escribir comoX - 66.8 = 0.232(V' - 154.2), o bienX = 31.0 + 0.232V. A esta ecuación se le conoce 
como la recta de regresión deX sobre Y y se utiliza para estimar X a partir de valores dados de Y. 

Obsérvese que, si se desea, también se puede emplear el método del problema 13.11. 

Segundo método 

Empleando la fórmula del problema 13.16, deX y V también se pueden sustraer cantidades adecuadas. Se sustraerá 
65 aX y 150 a Y. Los cálculos se pueden organizar como en la tabla 13.7. 


a N Z X'Y' - (E E)(E Y') _ (12)(708) - (22)(50) ^ 

a ‘ N E X' 1 — (E X') 2 (12)(232) — (22) 2 

b N Z X'Y' - (E E)(E E) _ (12)(708) - (50)(22) Q 
1 JVE1" 2 - (E Y'f (12)(2 868) — (50) 2 

Como X = 65 + 22/12 = 66.8 y Y = 150 + 50/12 = 154.2, las ecuaciones de regresión son Y - 154.2 = 3.22 
(X - 66.8) y X - 66.8 = 0.232(T - 154.2); es decir, Y = 3.22X - 60.9 y X = 0.232T + 31.0, en coincidencia con el primer 
método. 


13.18 Resolver el problema 13.17 usando MINITAB.Enun mismo conjunto de ejes, trazar la recta de regresión de 
pesos contra estaturas y la recta de regresión de estaturas contra pesos. M ostrar que el punto (X, Y) satisface 
ambas ecuaciones. Estas rectas se Intersecan en (X, Y). 
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SOLUCIÓN 


Gráfica de peso contra estatura, estatura contra peso 



Figura 13-12 Tanto la recta de regresión de estatura contra peso como la recta de 
regresión del peso contra estatura pasan a través del punto (x barra, y barra). 

(X, ?)eslo mismo que (x b a r r a , y barra ) y es igual a (66.83,154.17). Obsérvese que peso = 3.22(66.83) - 60.9 = 
154.17 y estatura = 31.0 + 0.232(154.17) = 66.83, Por lo tanto, ambas rectas pasan a través de (x barra,y barra). 


Tabla 13.8 


X' 

Y' 

X ' 2 

X'Y' 

Y a 

5 

5 

25 

25 

25 

-2 

0 

4 

0 

0 

7 

30 

49 

210 

900 

-5 

-15 

25 

75 

225 

1 

6 

1 

6 

36 

5 

18 

25 

90 

324 

9 

28 

81 

252 

784 

0 

10 

0 

0 

O 

O 

i—1 

-3 

-18 

9 

54 

324 

2 

-5 

4 

-10 

25 

0 

-11 

0 

0 

121 

3 

2 

9 

6 

4 

EX'= 22 

Ey' = 50 

EX ,2 = 232 

M 

>< 

II 

--J 

O 

oo 

E Y' 2 = 2 868 


APLICACIONES PARA SE RIES DE TIEMPO 

13.19 En la tabla 13.9 se presentan, en millones de dólares, las exportaciones agrícolas de Estados Unidos. Usar 
MINITAB para hacer lo siguiente: 


Tabla 13.9 


Año 

2000 

2001 

2002 

2003 

2004 

2005 

Valor total 

51246 

53 659 

53115 

59 364 

61383 

62 958 

Código del año 

1 

2 

3 

4 

5 

6 


Fuente: The 2007 Statistical Abstract. 
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a) Graficar los datos y mostrar la recta de regresión de mínimos cuadrados. 

b) Encontrar y graficar la recta de tendencia de los datos. 

c) Dar los valores ajustados y los residuales empleando los códigos de los años. 

d) Estimar el valor de las exportaciones agrícolas en 2006. 

SOLUCIÓN 

a) En la figura 13-13a) se muestran los datos y la recta de regresión. La gráfica que se muestra en la figura 13-13a) se 
obtiene empleando la secuencia Stat ^ Regresión Fitted lineplot. 


Gráfica de la recta ajustada 
valor total = —4 976 816 + 2 514 año 



dadas en millones de dólares. 


b) La gráfica que se muestra en la figura 13.13b) se obtiene empleando la secuencia Stat -> Time series -> Trend 
Análisis. Ésta es una manera diferente de ver los mismos datos. Tal vez sea un poco más fácil emplear los números 
índice (códigos de los años) en vez de los años. 


Gráfica del análisis de tendencia del valor total 
Modelo de tendencia lineal 
Y t = 48 156.1 + 2 513.74*t 



Variable 

-•- Real 

-■— Ajustada 


Figura 13-13 b) Recta de tendencia de las exportaciones agrícolas de Estados Unidos, 

dadas en millones de dólares. 
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c) En la tabla 13.10 sedan los valores ajustados y los residuales de los datos que se presentan en la tabla 13.9; se emplean 
años codificados. 


Tabla 13.10 


Año codificado 

Valor total 

Valor ajustado 

Residual 

1 

51246 

50 669.8 

576.19 

2 

53 659 

53 183.6 

475.45 

3 

53 115 

55 697.3 

-2 582.30 

4 

59 364 

58 211.0 

1152.96 

5 

61 383 

60 724.8 

658.22 

6 

62 958 

63 238.5 

-280.52 


d ) Empleando el año codificado, el valor estimado es Y t = 48 156.1 + 2 513.74(7) = 65 752.3. 

13.20 En la tabla 13.11 se presenta el poder de compra del dólar, medido a través de los precios al consumidor, de 
acuerdo con lo Informado por la Oficina de Estadísticas Laborales de Estados U nidos. 

Tabla 13.11 


Año 

2000 

2001 

2002 

2003 

2004 

2005 

Precios al consumidor 

0.581 

0.565 

0.556 

0.544 

0.530 

0.512 


Fuente: U. S. Bureau of Labor Statistics, Survey of Current Business. 


a) Graflcar los datos y obtener la recta de tendencia usando M I IMITA B. 

b) Encontrar, a mano, la ecuación de la línea de tendencia. 

c) Estimar el precio al consumidor del 2008 suponiendo que la tendencia continúe tres años más. 

SOLUCIÓN 

a) En la figura 13-14, la línea continua es la gráfica de los datos de la tabla 13.11 y la línea punteada es la gráfica de la 
recta de mínimos cuadrados. 


Gráfica del análisis de tendencia del poder de compra 
Modelo de tendencia lineal 
Y t = 0.5942 -0.0132*t 



índice 


Figura 13-14 Línea de tendencia del poder decompra. 
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b ) En la tabla 13.12 se presentan los cálculos para hallar, a mano, la línea de tendencia. La ecuación es 


y = 


E xy 

E-v 2 


X 


donde x = X - X y y = Y - Y; por lo que esta ecuación se puede escribir como Y - 0.548 = -0.0132(X - 3.5) o 
Y = -0.0132X + 0.5942. Como se ilustra con este problema, el trabajo que se ahorra empleando algún software para 
estadística es enorme. 


Tabla 13.12 


Año 

X 

Y 

I 

II 

j-í 

1 

II 

X 2 

xy 

2000 

1 

0.581 

-2.5 

0.033 

6.25 

-0.0825 

2001 

2 

0.565 

-1.5 

0.017 

2.25 

-0.0255 

2002 

3 

0.556 

-0.5 

0.008 

0.25 

-0.004 

2003 

4 

0.544 

0.5 

-0.004 

0.25 

- 0.002 

2004 

5 

0.530 

1.5 

-0.018 

2.25 

-0.027 

2005 

6 

0.512 

2.5 

-0.036 

6.25 

-0.09 


EX = 21 

E Y = 3.288 



Ex 2 

Exy 


X = 3.5 

Y = 0.548 



17.5 

-0.231 


c) El precio al consumidor estimado del 2008 se obtiene sustituyendo en la ecuación de la línea tendencia X = 9. El 
precio al consumidor estimado es 0.5942 - 0.0132(9) = 0.475. 


ECUACIONES NO LINEALES REDUCI BLES A LA FORMA LINEAL 

13.21 En la tabla 13.13 sedan los valores experimentales de la presión P de una masa dada de gas correspondientes 
a diversos valores del volumen V. De acuerdo con los principios de la termodinámica, entre estas variables 
existe una relación de la fórmula Pl / 7 = C, donde 7 y C son constantes. 

a) Encontrar los valores de 7 y de C. 

b) Escribir la ecuación que relaciona P y V. 


Tabla 13.13 


Volumen V en pulgadas cúbicas (in 3 ) 

54.3 61.8 72.4 88.7 118.6 194.0 

Presión P en libras por pulgada cuadrada (Ib/ln 2 ) 

61.2 49.2 37.6 28.4 19.2 10.1 


c) Estimar P paral/ = 100.0 (Ib/ln 2 ). 

SOLUCIÓN 

Como PV 7 = C, se tiene 

log P + 7 log 1/ = log C o bien log P = log C - 7 log 1/ 
Haciendo log 1/ =X y log P = Y, la última ecuación puede escribirse como 


(41) 


donde a 0 = log C y a : = -7. 


y -a 0 + aiX 
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En la tabla 13.14 se dan los valores deX = log 1/ y de Y = log P, correspondientes a los valores de V y P dados en 
la tabla 13.13, y se indican también los cálculos para obtener la recta (41) de mínimos cuadrados. Las ecuaciones normales 
correspondientes a la recta (41) de mínimos cuadrados son 

J2Y = a 0 N + a :£Z y £ XY = a 0 £ Z + a x £ Z 2 


de donde 


flo = (E rXS^-EJTXpr) = 4 . 20 B( = *E *r-(E *)(S r) = _ L40 

TV £ Z 2 - (£ Z) 2 TV £ Z 2 - (£ Z) 2 

Por lo tanto, Y = 4.20 - 1.40X. 

a) Como a 0 = 4.20 = log C y a x = -1.40 = -7, C = 1.60 x 10 4 y 7 = 1.40. 

b) La ecuación que se busca en términos de P y 1/ se puede escribir como Pl/ 1,40 = 16 000. 

c) Para V = 100, X = log V = 2 y Y = log P = 4.20 - 1.40(2) = 1.40. Entonces P = antllog 1.40 = 25.1 lb/in 2 . 


Tabla 13.14 


X = log V 

Y = log P 

X 2 

XY 

1.7348 

1.7868 

3.0095 

3.0997 

1.7910 

1.6946 

3.2077 

3.0350 

1.8597 

1.5752 

3.4585 

2.9294 

1.9479 

1.4533 

3.7943 

2.8309 

2.0741 

1.2833 

4.3019 

2.6617 

2.2878 

1.0043 

5.2340 

2.2976 

£X = 11.6953 

£ y = 8.7975 

£X 2 = 23.0059 

£XT = 16.8543 


13.22 Usar M IIMITAB para resolver el problema 13.21. 

SOLUCIÓN 

Las transformacionesX = log t (V) y Y = log t (P) convierten el problema en un problema de ajuste lineal. Para encontrar los 
logaritmos comunes del volumen y de la presión se emplea la calculadora de M INITAB. En las columnas C1 a C4 de la 
hoja de cálculo de M INITAB se tendrá: 


y 

P 

LoglOí/ 

LoglOP 

54.3 

61.2 

1.73480 

1.78675 

61.8 

49.2 

1.79099 

1.69197 

72.4 

37.6 

1.85974 

1.57519 

88.7 

28.4 

1.94792 

1.45332 

118.6 

19.2 

2.07408 

1.28330 

194.0 

10.1 

2.28780 

1.00432 


El ajuste por mínimos cuadrados da: log 10 (P) = 4.199 - 1.402 log 10 (V). Ver la figura 13-15. a 0 = log C y a x = -7. 
Sacando antiIogaritmos se obtiene C = 10 a ° y 7 = -a : o C = 15 812 y 7 = 1.402. La ecuación no lineal es py 1,402 = 
15 812. 
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Gráfica de la recta ajustada 
log 10 P = 4.199- 1.402 log 10 l/ 



Figura 13-15 Reducción de una ecuación no lineal a la forma lineal. 


13.23 En la tabla 13.15 se da, en millones, la población de Estados Unidos desde 1960 hasta 2005. A estos datos, 
ajustar una recta y una parábola y analizar los dos ajustes. Usar ambos modelos para predecirla población que 
tendrá Estados U nidos en 2010. 


Tabla 13.15 


Año 

1960 

1965 

1970 

1975 

1980 

1985 

1990 

1995 

2000 

2005 

Población 

181 

194 

205 

216 

228 

238 

250 

267 

282 

297 


Fuente: U .S. Bureau of Census. 


SOLUCIÓN 

A continuación se presenta parte de los resultados que da M INITAB para la recta de mínimos cuadrados y para la parábola 
de mínimos cuadrados. 


Año 

Pobl acl ón 

X 

xc u a d r a d a 

1960 

181 

1 

1 

1965 

194 

2 

4 

1970 

205 

3 

9 

1975 

216 

4 

16 

1980 

228 

5 

25 

1985 

238 

6 

36 

1990 

250 

7 

49 

1995 

267 

8 

64 

2 0 0 0 

282 

9 

81 

2 0 0 5 

297 

10 

100 


El modelo para la recta es el siguiente: 
La ecuación de regresión es 

Población = 166 + 12.6 x 

El modelo cuadrático es el siguiente: 

La ecuación de regresión es 

Población = 174 + 9.3 x - 0.326 x 2 
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En la tabla 13.16 se dan los valores ajustados y los residuales del ajuste a los datos mediante la recta. 


Tabla 13.16 


Año 

Población 

Valor ajustado 

Residual 

1960 

181 

179.018 

1.98182 

1965 

194 

191.636 

2.36364 

1970 

205 

204.255 

0.74545 

1975 

216 

216.873 

-0.87273 

1980 

228 

229.491 

-1.49091 

1985 

238 

242.109 

-4.10909 

1990 

250 

254.727 

-4.72727 

1995 

267 

267.345 

-0.34545 

2000 

282 

279.964 

2.03636 

2005 

297 

292.582 

4.41818 


En la tabla 13.17 se dan los valores ajustados y los residuales correspondientes al ajuste parabólico a los datos. La 
suma de los cuadrados de los residuales en el caso de la recta es 76.073 y la suma de los cuadrados de los residuales en el 
caso de la parábola es 20.042. Parece que, en general, la parábola se ajusta mejor que la recta a estos datos. 


Tabla 13.17 


Año 

Población 

Valor ajustado 

Residual 

1960 

181 

182.927 

-1.92727 

1965 

194 

192.939 

1.06061 

1970 

205 

203.603 

1.39697 

1975 

216 

214.918 

1.08182 

1980 

228 

226.885 

1.11515 

1985 

238 

239.503 

-1.50303 

1990 

250 

252.773 

-2.77273 

1995 

267 

266.694 

0.30606 

2000 

282 

281.267 

0.73333 

2005 

297 

296.491 

0.50909 


Para predecir cuál será la población en el año 2010, obsérvese que el código para 2010 es 11. El valor que se obtie¬ 
ne con el modelo de la recta es población = 166 + 12.6x = 166 + 138.6 = 304.6 millones y con el modelo de la parábola 
es población = 174 + 9.03* + 0.326x 2 = 174 + 99.33 + 39.446 = 312.776. 
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PROBLEMAS SUPLEMENTARIOS 


LÍNEAS RECTAS 

13.24 Si 3X + 2 Y = 18, encontrar: a) el valor deX para Y = 3, b) el valor de y paraX = 2, c) el valor deX para Y = -5, d) el 
valor de y paraX = -1, e) la intersección con el ejeX, y f) la intersección con el ejey. 

13.25 En un mismo conjunto de ejes, trazar la gráfica de las ecuaciones: a) y = 3X - 5 y b) X + 2y = 4. ¿En qué punto se inter¬ 
secan? 

13.26 a) Encontrar la ecuación de la recta que pasa por los puntos (3, -2) y (-1, 6). 

b ) Determinar las intersecciones de la recta del inciso a) con el ejeX y con el eje Y. 

c) E ncontrar el valor de y que corresponde aX = 3yaX = 5. 

d) A partir de la gráfica, verificar sus respuestas a los incisos a), b ) y c). 

13.27 Encontrar la ecuación de la recta cuya pendiente es § y cuya intersección con el eje y es -3. 

13.28 a) Encontrar la pendiente y la intersección con el eje y de la recta cuya ecuación es 3X - 5y = 20. 
b) ¿Cuál es la ecuación de la recta paralela a la recta del inciso a) y qué pasa por el punto (2,-1)? 

13.29 Encontrar: a) la pendiente, b) la intersección con el eje y y c) la ecuación de la recta que pasa por los puntos (5, 4) y 
(2,8). 

13.30 Encontrar la ecuación de la recta cuyas intersecciones con los ejesX y y son 3 y -5, respectivamente. 

13.31 La temperatura de 100 grados Celsius (°C) corresponde a 212 grados Fahrenheit (°F), en tanto que la temperatura de 0°C 
corresponde a 32°F. Suponiendo que exista una relación lineal entre temperaturas Celsius y temperaturas Fahrenheit, encon¬ 
trar: a) la ecuación que relaciona temperaturas Celsius y temperaturas Fahrenheit, b) la temperatura Fahrenheit que corres¬ 
ponde a 80°C y c) la temperatura Celsius que corresponde 68°F. 

LARECTADE MÍNIMOS CUADRADOS 

13.32 Ajustar una recta de mínimos cuadrados a los datos de la tabla 13.18 usando: a) X como la variable independiente y b) X 
como la variable dependiente. Graficar los datos de estas rectas de mínimos cuadrados en un mismo eje de coordenadas. 


Tabla 13.18 


X 

3 

5 

6 

8 

9 

11 

y 

2 

3 

4 

6 

5 

8 


13.33 Dados los datos del problema 13.32, hallar: a) el valor de Y paraX = 12 y b) el valor deX para Y = 7. 

13.34 a) Empleando el método a mano, obtener una ecuación de la recta que se ajuste a los datos del problema 13.32. 
b) Empleando el resultado del inciso a), resolver el problema 13.33. 

13.35 En la tabla 13.19 se muestran las calificaciones finales de álgebra y de física de diez estudiantes, tomados en forma aleato¬ 
ria de un grupo grande. 

a) Graficar los datos. 

b) Encontrar la recta de mínimos cuadrados que se ajusta a los datos, usando X como la variable independiente. 
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c) Encontrar la recta de mínimos cuadrados que se ajusta a los datos, usando Y como la variable independiente. 

d) Si la calificación de un estudiante en álgebra es 75, ¿cuál es la calificación que se espera que obtenga en física? 

e) Si la calificación de un estudiante en física es 95, ¿cuál es la calificación que se espera que obtenga en álgebra? 


Tabla 13.19 


Álgebra (X) 

75 

80 

93 

65 

87 

71 

98 

68 

84 

77 

Física (Y) 

82 

78 

86 

72 

91 

80 

95 

72 

89 

74 


13.36 En la tabla 13.20 se muestra la tasa de nacimiento por cada mil personas desde 1998 hasta 2004. 

a) Graficar estos datos. 

ó) Hallar la recta de mínimos cuadrados que se ajusta a estos datos. Asignar a los años 1998 a 2004 los números 1 a 7. 

c) Calcular los valores de tendencia (valores ajustados) y los residuales. 

d) Indicar cuál será la tasa de nacimiento en 2010, suponiendo que la tendencia actual continúa. 


Tabla 13.20 


Año 

1998 

1999 

2000 

2001 

2002 

2003 

2004 

Tasa de nacimientos por cada 1 000 

14.3 

14.2 

14.4 

14.1 

13.9 

14.1 

14.0 


Fuente: U.5. Nacional Center for Health Statlstics, Vital Statisticsof the United Status, annual; Nacional Vital Statlstics 
Reports y datos inéditos. 


13.37 En la tabla 13.21 se presenta, en miles, la población de Estados U nidos de 85 o más años, desde 1999 hasta 2005. 

a) Graficar estos datos. 

b ) Encontrar la recta de mínimos cuadrados que se ajusta a estos datos. Asignar a los años 1999 a 2005 los números 1 
a 7. 

c) Calcular los valores de tendencia (valores ajustados) y los residuales. 

d) Suponiendo que la tendencia actual continúe, indicar cuál será el número de personas de 85 años o más en el 2010. 


Tabla 13.21 


Año 

1999 

2000 

2001 

2002 

2003 

2004 

2005 

85 o más 

4 154 

4 240 

4 418 

4 547 

4 716 

4 867 

5 096 


Fuente: U.S. Bureau of Census. 


CURVASDE MÍNIMOSCUADRADOS 

13.38 Ajustar una parábola de mínimos cuadrados, Y = a 0 + a-¡X + a 2 X 2 , a los datos de la tabla 13.22. 


Tabla 13.22 


X 

0 

1 

2 

3 

4 

5 

6 

Y 

2.4 

2.1 

3.2 

5.6 

9.3 

14.6 

21.9 
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13.39 El tiempo requerido para llevar un automóvil al alto total a partir de que se percibe un peligro es el tiempo de reacción (el 
tiempo entre el reconocimiento del peligro y la aplicación del freno) más el tiempo de frenado (el tiempo necesario para 
que el automóvil se detenga después de la aplicación del freno). En la tabla 13.23 se da la distancia de frenado D (en pies, 
ft) de un automóvil que va a una velocidad V (en millas por hora, mi/h). 

a) Graficar D contra V. 

b ) Ajustar a estos datos una parábola de mínimos cuadrados de la forma D = a 0 + + a 2 V 2 . 

c) Estimar D para 1/= 45 mi/h y 80 mi/h. 


Tabla 13.23 


Velocidad 1/ (mi/h) 

20 

30 

40 

50 

60 

70 

Distancia de frenado D (ft) 

54 

90 

138 

206 

292 

396 


13.40 En la tabla 13.24 se presenta, en millones, la población de hombres y de mujeres en Estados U nidos, desde 1940 hasta 2005. 
Se presentan también los números dados como códigos a los años y la diferencia de hombres menos mujeres. 

a) Graficar los datos y la recta de mejor ajuste por mínimos cuadrados. 

b ) Graficar los datos y el mejor ajuste cuadrático por mínimos cuadrados. 

c) Graficar los datos y el mejor ajuste cúbico por mínimos cuadrados. 

d) Con cada uno de los tres modelos, dar el valor ajustado y los residuales, así como la suma de los cuadrados de los 
residuales. 

e) Emplear cada uno de los tres modelos para predecir la población que habrá en el año 2010. 


Tabla 13.24 


Año 

1940 

1950 

1960 

1970 

1980 

1990 

2000 

2005 

Código 

0 

1 

2 

3 

4 

5 

6 

6.5 

Hombres 

66.1 

75.2 

88.3 

98.9 

110.1 

121.2 

138.1 

146.0 

M ujeres 

65.6 

76.1 

91.0 

104.3 

116.5 

127.5 

143.4 

150.4 

Diferencia 

0.5 

-0.9 

-2.7 

-5.4 

-6.4 

-6.3 

-5.3 

-4.4 


Fuente: U .S. Bureau of Census. 


13.41 Resolver el problema 13.40 empleando, en lugar de las diferencias, la proporción entre mujeres y hombres. 

13.42 Resolver el problema 13.40 ajustando una parábola de mínimos cuadrados a las diferencias. 

13.43 En la tabla 13.25 se presenta la cuenta bacteriana Y, por unidad de volumen en un cultivo, después deX horas. 


Tabla 13.25 


Número de horas (X) 

0 1 2 3 4 5 6 

Cuenta bacteriana por unidad de volumen (Y) 

32 47 65 92 132 190 275 


a) Graficar los datos en papel semilogarítmlco usando la escala logarítmica para y y la escala aritmética paraX. 

b ) Ajustar a los datos una curva de mínimos cuadrados de la forma Y = ab x y explicar por qué esta ecuación dará buenos 
resultados. 

c) Comparar los valores de Y que se obtienen con esta ecuación con los valores reales. 

d) Estimar el valor de Y paraX = 7. 

13.44 En el problema 13.43 mostrar cómo usar una gráfica en papel semilogarítmico para obtener la ecuación buscada sin emplear 
el método de mínimos cuadrados. 


















TEORÍA DE 
LA CORRELACIÓN 



CORRELACIÓN Y REGRESIÓN 

En el capítulo 13 se consideró el problema de la regresión, o estimación de una variable (la variable dependiente) a 
partir de una o más variables (las variables Independientes). En este capítulo se hará referencia a un problema relacio¬ 
nado con el de la correlación o grado de relación entre las variables, en el que se busca determinar qué tan bien una 
ecuación lineal, o de otro tipo, describe o explica la relación entre las variables. 

SI todos los valores de las variables satisfacen con exactitud una ecuación, se dice que las variables están en per¬ 
fecta correlación o que hay una correlación perfecta entre ellas. Así, las circunferencias C y los radios r de todos los 
círculos están perfectamente correlacionados, ya queC = 2nr. Cuando se lanzan 100 veces dos dados en forma simul¬ 
tánea entre los puntos que aparecen en cada uno de ellos no hay relación alguna (a menos que estén cargados); es decir, 
no están correlacionados. Sin embargo, variables como el peso y la estatura de una persona muestran cierta correla¬ 
ción. 

Cuando Intervienen sólo dos variables se habla de correlación simple y de regresión simple. Cuando Intervienen 
más dedos variables, se habla de correlación múltiple y de regresión múltiple. En este capítulo sólo se considerará la 
correlación simple. En el capítulo 15 se consideran la correlación y la regresión múltiples. 

CORRELACIÓN LINEAL 

SI X y Y son las dos variables en consideración, un diagrama de dispersión sirve para mostrar la localización de los 
puntos (X, Y) en un sistema de coordenadas rectangulares. SI en este diagrama de dispersión todos los puntos parecen 
encontrarse cerca de una línea recta, como en las figuras 14-la) y 14-Ib), a la correlación se le llama lineal. En estos 
casos, como se vio en el capítulo 13, una ecuación lineal es lo apropiado con el propósito de regresión (o estima¬ 
ción). 

SI y tiende a aumentar a medida queX aumenta, como en la figura 14-la), se dice que la correlación es una corre¬ 
lación positiva o directa. Si Y tiende a disminuir a medida queX aumenta, como en la figura 14-Ib), se dice que es una 
correlación negativa o inversa. 

SI todos los puntos parecen encontrarse en una curva, esta correspondencia se llama no lineal, y según se vio en el 
capítulo 13, lo apropiado para la regresión es una ecuación no lineal. Es claro que la correlación no lineal puede ser 
algunas veces positiva y otras veces negativa. 

SI no parece haber relación éntrelas variables, como en la figura 14-le), se dice que no hay relación entre ellas (es 
decir, están descorrelacionadas). 
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C) 

Figura 14-1 Ejemplos de correlación positiva, correlación negativa y ninguna 
correlación, a) El salario inicial y los años de estudio se correlacionan en forma positiva; 
b) el promedio de las calificaciones escolares y las horas que se pasa viendo la televisión 
se correlacionan negativamente; c) entre la cantidad de horas que se habla por teléfono 
y el número de letras que tiene el nombre de una persona no hay correlación. 



MEDIDAS DE LA CORRELACIÓN 

M ediante observación directa se puede determinar de manera cualitativa que también una recta o una curva describe 
la relación éntrelas variables. Por ejemplo, se ve que una línea recta es mucho más útil para describir la relación entre 
X y Y en el caso de los datos de la figura 14-la) que en el caso de los datos de la figura 14-lb), debido a que en la 
figura 14-la) hay menos dispersión con relación a la recta. 

Para ocuparse de manera cuantitativa del problema de la dispersión de los datos muéstrales respecto a una línea o 
a una curva, es necesario encontrar una medida de la correlación. 


LAS RECTAS DE REGRESIÓN DE MÍNIMOS CUADRADOS 

Primero se considerará el problema de qué tan bien una línea recta explica la relación entre dos variables. Para esto, 
se necesitarán las ecuaciones de las rectas de regresión por mínimos cuadrados obtenidas en el capítulo 13. Como se 
ha visto, la recta de regresión por mínimos cuadrados de Y sobreX es 


y — a¡) + a±X 


( 1 ) 
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donde a 0 y a : se obtienen de las ecuaciones normales 

E y = a 0 N + a { E X 
E xy = a 0 e X + a\ E ^ 2 


quedan 


a (E Y)( E^ 2 )-(E *)(E XY) 
0 N E ^r 2 - (E *) 2 

_ nj:xy-(j: x)(e y) 
fll AT E X 2 - (E xf 

De igual manera, la recta de regresión deX sobre y es 

X - b 0 + b]Y 

donde b 0 y b 1 se obtienen de las ecuaciones normales 


£X =b 0 N +b { J2Y 
XY = b 0 J2 X + bi E Y 2 

quedan 


( 2 ) 


( 3 ) 


(4) 


(5) 


¿i = 


(E*)(E y 2 ) - (E y)(E^y) 

xE^ 2 -(E n 2 
neyy-íj: jt)(e ^ 
XL7 2 -(E y) 2 


Las ecuaciones (1) y (4) pueden expresarse, respectivamente, como 


y = 



X y 


X = 



( 6 ) 


(7) 


donde x = X - X y y = Y - Y. 

Las ecuaciones de regresión son idénticas si y sólo si todos los puntos del diagrama de dispersión se encuentran en 
una recta. En tales casos, existe una correlación lineal perfecta entreX y Y. 

EL ERROR ESTÁNDAR DE ESTIMACIÓN 

Si Y est es el valor estimado para Y, empleando la ecuación (1), para un valor dado deX, una medida de la dispersión 
respecto a la recta de regresión de Y sobreX es la cantidad 


S Y.X 


/ E (^~ Test) 2 

N 


(8) 


a la que se le llama error estándar de estimación de Y sobreX. 
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Empleando la recta de regresión (4), el error estándar de estimación análogo, deX sobre y, es 


Sx.Y 


/ £ i.* ~ *est) 

N 


(9) 


En general, s YX *s xy . 

La ecuación (8) también puede expresarse en la forma 

„2 E5 ,2 -«oEí'-«iE^ nn) 

que puede ser más apropiada para hacer los cálculos (ver problema 14.3). Para la ecuación (9) existe una expresión 
similar. 

El error estándar de estimación tiene propiedades análogas a la desviación estándar. Por ejemplo, si se trazan rectas 
paralelas a la recta de regresión de y sobreX a las distancias verticales s yx , 2 s YX y 3s rx , se hallará, si N es suficiente¬ 
mente grande, que entre estas rectas se encuentra 68%, 95% y 99.7% de los puntos muéstrales, respectivamente. 

Así como la desviación estándar modificada, que es 


s 


\ 


s 


se emplea para muestras pequeñas, también el error estándar de estimación modificado está dado por 


Srjc - \Iw^2 Sy ' x 

A esto se debe que algunos especialistas en estadística prefieran definir las ecuaciones (8) y (9) empleando N - 2 en 
el denominador en lugar de N. 


VARIACIÓN EXPLICADA Y NO EXPLICADA 

La variación total de Y se define como £ (F - Y) 2 ; es decir, la suma de los cuadrados de las desviaciones de y res¬ 
pecto a la media Y. Como se muestra en el problema 14.7, esta expresión se puede expresar como 

£ ( 7 - Y ) 2 = £ ( Y - F est ) 2 + £ (F est - f ) 2 (11) 

En la ecuación (11), al primer término del lado derecho se le llama variación no explicada, en tanto que al segun¬ 
do término se le llama variación explicada ; se les llama así debido a que las desviaciones Test - Y tienen un patrón 
definido; en cambio, las desviaciones Y - y est son aleatorias o impredecibles. Para la variableX existe una fórmula 
similar. 


COEFICIENTE DE CORRELACIÓN 

Al cociente de la variación explicada entre la variación total se le llama coeficiente de determinación. SI hay cero 
variación explicada (es decir, si la variación total es sólo variación no explicada), este cociente es 0. SI hay 0 variación 
no explicada (es decir, si la variación total es sólo variación explicada), este cociente es 1. En los demás casos, este 
cociente se encuentra entre 0 y 1; como siempre es no negativo, se denota r 2 . A la cantidad r se le llama coeficiente de 
correlación; está dado por 


variación explicada 
variación total 


= ±i 


/ £(Fes t - ñ 

E(y-y) 2 


r = ± 


( 12 ) 
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y varía entre-1 y +1. Los signos + y - se usan para correlación lineal positiva y correlación lineal negativa, respec¬ 
tivamente. Obsérvese que res una cantidad adimensional; es decir, no depende de las unidades que se empleen. 
Utilizando las ecuaciones (8) y (11) y el hecho deque la desviación estándar de Y es 


S Y 


E (Y-Y) 2 


N 


se encuentra que la ecuación (12) puede expresarse, sin hacer caso del signo, como 


(13) 





o bien 


s y.x — S Y 


= s Y V 1 — r 2 


(14) 


SI se Intercambian X y Y se obtienen ecuaciones similares. 

En el caso de la correlación lineal, la cantidad r es la misma, ya sea que se considere a X o a Y como la variable 
Independiente. Por lo tanto r es una muy buena medida de la correlación lineal entre dos variables. 


OBSERVACIONES ACERCA DEL COEFICIENTE DE CORRELACIÓN 

Las definí dones del coeficiente de correlación dadas en las ecuaciones (12) y (14) son muy generales y pueden emplear¬ 
se tanto para relaciones no lineales como para relaciones lineales; la única diferencia es que Y est se calcula a partir de 
una ecuación de regresión no lineal y no a partir de una ecuación de regresión lineal, y que los signos + y - se omiten. 
En estos casos la ecuación (8), que define el error estándar de estimación, es perfectamente general. Sin embargo, la 
ecuación (10) que se emplea únicamente para regresión lineal, debe ser modificada. Si, por ejemplo, la ecuación de 
estimación es 


Y — ciq -\- Q\X -(- • • • ~\~ ci n _\X 


(15) 


la ecuación (10) se reemplaza por 


2 E Y ~- a oE Y ~a\E XY - ««-i E x ” 

S Y.X — - 


N 


( 16 ) 


En este caso, el error estándar de estimación modificado (antes visto en este capítulo) es 


SYX -\jW^n SY - X 

en donde a la cantidad N - n se le conoce como número de grados de libertad. 

Hay que subrayar que en todos los casos, el valor calculado para r mide el grado de relación respecto al tipo de 
ecuación que se emplee. Así, si se utiliza una ecuación lineal y con la ecuación (12) o (14) dan un valor der cercano 
a cero, esto significa que entre las variables casi no hay correlación lineal. Pero esto no significa que no haya correla¬ 
ción alguna, pues entre estas variables puede haber una fuerte correlación no lineal. En otras palabras, el coeficiente 
de correlación mide la bondad de ajuste entre: 1) la ecuación empleada y 2) los datos. A menos que se especifique otra 
cosa, el término coeficiente de correlación se emplea con el significado de coeficiente de correlación lineal. 

H ay que hacer notar también que un coeficiente de correlación elevado (es decir, cercano a 1 o a -1) no necesa¬ 
riamente Indica que haya dependencia directa entre las variables. Así, por ejemplo, puede haber correlación elevada 
entre la cantidad de libros publicados anualmente y cantidades número de tormentas eléctricas por año. A los ejemplos 
de este tipo o se le conoce como correlaciones sin sentido o espurias. 
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FÓRMULAPRODUCTO-MOMENTO PARAEL COEFICIENTE 
DE CORRELACIÓN LINEAL 


Si se supone que entre dos variables existe una relación lineal, la ecuación (12) se convierte en 


E x y 

V(Z* 2 )(Z y 2 ) 


(17) 


donde x = X - X y y = Y - Y (ver el problema 14.10). Esta fórmula, que automáticamente da el signo adecuado de 
r se conoce como fórmula del producto-momento y permite ver claramente la simetría entreX y Y. 

Si se escribe 


S XY 


Z xy 

N 




(18) 


entonces s x y s Y se reconocerán como las desviaciones estándar deX y de y, respectivamente, y s\ y s Y son las varlan- 
zas. La nueva cantidad s XY es la covarianza deX y Y. En términos de la fórmula (18), la fórmula (17) puede expresar¬ 
se como 


r = ^- uy¡ 

S X S Y 

Obsérvese que r no sólo es independiente de las unidades deX y de Y, sino también de la elección del origen. 

FÓRMULAS SIMPLIFICADAS PARAEL CÁLCULO 

La fórmula (17) puede expresarse de la siguiente manera equivalente 

«E^-(E^)(E y) {20) 

V^E^-ÍE x ) 2 }[ n Z y 2 -(Z Y) 2 ] 

con frecuencia empleada para el cálculo de r. 

Para datos agrupados como los de una tabla de frecuencias bivariadas o distribución de frecuencias bivariadas 
(ver problema 14.17), conviene emplear un método de compilación como los de capítulos anteriores. En ese caso, la 
fórmula (20) puede expresarse 


_ N Z.f u x u Y — (Z fxU\)(Z Íy u y) _ 

yJ[N Zfx u x — (E fx u xY\[N Z Íy u \ ~~ (E /y (< y)~] 


( 21 ) 


(ver problema 14.18). Cuando se emplea esta fórmula, para facilitar los cálculos se emplea una tabla de correlación 
(ver problema 14.19). 

En el caso de datos agrupados, las fórmulas (18) se pueden expresar como 


S XY — C X C Y 


Z f u X ll Y _ Í Z.fx ll x \ Í Z Iy u Y 
N \ N )\N 


s x — c x 


Z fx U X ^E fx u x ^ ' 


Sy — Cy\ 


Z/yu\ (Z/yUy 


N 


V N 


( 22 ) 

(23) 

(24) 


dondec x y c Y son las amplitudes de los Intervalos de clase (que se suponen constantes) correspondientes a las variables 
X y Y, respectivamente. Obsérvese que las fórmulas (23) y (24) son equivalentes a la fórmula (11) del capítulo 4. 
Empleando las fórmulas (22) y (24), la fórmula (19) parece ser equivalente a la fórmula (21). 
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RECTAS DE REGRESIÓN Y EL COEFICIENTE DE CORRELACIÓN LINEAL 

La ecuación de la recta de regresión por mínimos cuadrados Y = a 0 + a : X, la recta de regresión de Y sobreX, puede 
expresarse como 


7-Y = —(X-X) o bien y = — x (25) 

s x s x 

De igual manera, la recta de regresión deX sobre Y, X = b 0 + f^Y, puede expresarse como 

X-X = — (Y-Y) o bien x = — y (26) 

Sy Sy 

Las pendientes de las rectas de regresión (25) y (26) son iguales si y sólo si r = ±1. En esos casos las dos rectas 
son idénticas y existe una perfecta correlación entreX y Y. Si r = 0, las rectas forman ángulos rectos y no hay corre¬ 
lación lineal entreX y Y. Por lo tanto, el coeficiente de correlación lineal mide qué tanto se apartan las dos rectas de 
regresión. 

Obsérvese que si las ecuaciones (25) y (26) se expresan como Y = a 0 + a-¡X y X = b 0 + b x Y, respectivamente, 
entonces = r 2 (ver problema 14.22). 

CORRELACIÓN DE SERIES DE TIEMPO 

Si las vari ables X y Y dependen del tiempo, es posible que entreX y Y exista una relación, aunque esta relación no sea, 
necesariamente, de dependencia directa y produzca una "correlación sin sentido". El coeficiente de correlación se 
obtiene considerando los pares de valores (X, Y) correspondientes a los distintos tiempos y procediendo como de cos¬ 
tumbre, haciendo uso de las fórmulas anteriores (ver problema 14.28). 

También se puede tratar de correlacionar los valores de una variable X en cierto tiempo con los correspondientes 
valores deX en un tiempo anterior. A esta correlación se le llama autocorrelación. 

CORRELACIÓN DE ATRIBUTOS 

Los métodos descritos en este capítulo no permiten considerar la correlación entre variables, por naturaleza, no numé¬ 
ricas; por ejemplo, atributos de individuos (como color de pelo, color de ojos, etc.). La correlación de atributos se 
analiza en el capítulo 12. 


TEORÍA MUESTRAL DE LA CORRELACIÓN 


Los N pares de valores (X, Y) de dos variables pueden considerarse como muestras de una población que consta de 
todos estos pares. Como hay dos variables, a esta población se le llama población bivariada, la que se supondrá tiene 
una distribución normal bivariada. 

Se puede pensar que existe un coeficiente de correlación poblacional teórico, denotado p, que se estima por el 
coeficiente de correlación muestral r. Las pruebas de significancia o de hipótesis relacionadas con los diferentes valo¬ 
res de p requieren del conocimiento déla distribución muestral der. Para p = 0 esta distribución es si métrica y se usa 
un estadístico que implica la distribución de Student. Para p* 0 esta distribución es sesgada; en ese caso, una trans¬ 
formación desarrollada por Fischer da un estadístico que está distribuido en forma aproximadamente normal. Las 
pruebas siguientes resumen los procedimientos empleados: 


1. Prueba de hipótesis p = 0. Aquí se emplea el hecho de que el estadístico 

_ r\/N - 2 


(27) 


tiene una distribución de Student con v= N - 2 grados de libertad (ver problemas 14.31 y 14.32). 
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2. Prueba de hipótesis p = p 0 + 0. Aquí se emplea el hecho de que el estadístico 

Z = 5 l0 ^(l3;) = 11513 lo gio(^) (28) 

donde e = 2.71828..., está distribuido de manera casi normal, con media y desviación estándar dadas por 

= 1291 

Las ecuaciones (28) y (29) también pueden usarse para hallar los límites de confianza para los coeficientes de 
correlación (ver problemas 14.33 y 14.34). La ecuación (28) se llama transformación Z deFischer. 

3. Significancia de una diferencia entre coeficientes de correlación. Para determinar si dos coeficientes de corre¬ 
lación r 1 y r 2 , obtenidos de muestras de tamaños N 1 y A/ 2 , respectivamente, difieren de manera notable uno de otro, 
empleando la ecuación (28) se calculan los valores Z 1 y Z 2 correspondientes a r 1 y r 2 . Después se usa el hecho de 
que el estadístico de prueba 


X\ — Z 2 — Pz,-z 2 
(J Z ¡ -z 2 


donde 


A l z¡-z 2 — Hz¡ ~ Mz 2 


Y 


a z,-z 7 - 


cr 7 . = 


jV[ — 3 N 2 - 3 


está distribuido en forma normal (ver problema 14.35). 


(30) 


TEORÍA MUESTRAL DE LA REGRESIÓN 

La ecuación de regresión Y = a 0 + a : X se obtiene basándose en datos muéstrales. Se desea conocer la correspondien¬ 
te ecuación de regresión para la población de la que se obtuvo la muestra. A continuación se presentan tres pruebas 
relacionadas con esta población: 

1. Prueba de hipótesis a x =A V Para probar la hipótesis deque el coeficiente de regresión a 1 es Igual a algún valor 
dadoA 1; se emplea el hecho de que el estadístico 


t = a ‘ , Al VÑ^2 (31) 

Sy.X/Sx 

tiene una distribución deStudent con N - 2 grados de libertad. Esto también se puede emplear para hallar Interva¬ 
los de confianza para los coeficientes de regresión poblacional a partir de valores muéstrales (ver los problemas 
14.36 y 14.37). 

2. Prueba de la hipótesis para valores pronosticados. Sea Y 0 el valor pronosticado para Y, correspondiente a X = 
X 0 , mediante la ecuación de regresión muestral (es decir, y 0 = a 0 + a 1 X 0 ). Sea Y P el valor pronosticado para Y que 
corresponde a X =X 0 en la población. Entonces, el estadístico 

t = - _ - VÑ^2 = - F ° ~ (32) 

s Y.x\JN + 1 4- (X 0 — X) 2 /s 2 x Sx.ysJ 1 + 1/TV+ (X Q — X) 2 /(Ns 2 x ) 

tiene una distribución deStudent con N - 2 grados de libertad. A partir de esta fórmula se pueden hallar límites de 
confianza para valores poblacional es pronosticados (ver el problema 14.38). 
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3. Prueba de hipótesis para valores pronosticados para la media. Sea Y 0 el valor pronosticado para Y, correspon¬ 
diente a X = X 0 , empleando la ecuación de regresión muestral (es decir, Y 0 = a 0 + a-¡X 0 ). Sea Y p el valor medio 
pronosticado de Y que corresponde a X =X 0 en la población. Entonces el estadístico 

t = - Y °~ Yp _ VÑ^2 = - _ _ (33) 

s y.x\J 1 + (*o — X) 1 /s 2 x §y.x\J 1 /N + (X 0 - X)~/(Ns 2 x ) 

tiene una distribución deStudent con N - 2 grados de libertad. A partir de esta fórmula se pueden hallar límites de 
confianza para valores pronosticados para la media poblacional (ver el problema 14.39). 


PROBLEMAS RESUELTOS 
DIAGRAMASDE DISPERSIÓNY RECTASDE REGRESIÓN 
14.1 En la tabla 14.1 X y Y son las estaturas de 12 padres y desús hijos mayores. 

a) Con estos datos, construir un diagrama de dispersión. 

b) Resolviendo las ecuaciones normales, encontrar la línea de regresión de mínimos cuadrados correspon¬ 
diente a la estatura del padre sobre la estatura del hijo. También encontrar esta línea empleando SPSS. 

c) Resolviendo las ecuaciones normales, encontrarla línea de regresión de mínimos cuadrados correspondien¬ 
te a la estatura del hijo sobre la estatura del padre. Encontrar también esta línea empleando STATISTIX. 


Tabla 14.1 


EstaturaX del padre (¡n) 

65 

63 

67 

64 

68 

62 

70 

66 

68 

67 

69 

71 

Estatura Y del hijo (¡n) 

68 

66 

68 

65 

69 

66 

68 

65 

71 

67 

68 

70 


SOLUCIÓN 

a) El diagrama de dispersión se obtiene graficando los puntos (X, Y) en un sistema de coordenadas rectangulares, como 
el que se muestra en la figura 14-2. 


71 - • 

70 - • 

O 

69 - 

13 

■O 

m 68 - • • • • 

| 67 - 

66 - • • 

65 - • • 

- 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 

62 63 64 65 66 67 68 69 70 71 

Estatura del padre 

Figura 14-2 Diagrama de dispersión de los datos de la tabla 14.1. 


b ) La recta de regresión de Y sobreX es Y = a 0 + a^X, donde a 0 y a L se obtienen resolviendo las ecuaciones normales. 

E ^ = a oN + J2 X 

J2 XY = a 0 Y, X + di J2 X 2 
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En la tabla 14.2 se presentan las sumas a partir de las cuales las ecuaciones normales son 

1280 + 8008!= 811 
800a 0 + 53 4188, = 54 107 

de donde se encuentra que a 0 = 35.82 y a 1 = 0.476, con lo que Y = 35.82 + 0.476X. 

A continuación se presenta parte del resultado que se obtiene con la secuencia Analyze—> Regresión —> Linear de 
SPSS. 


Coeficientes 3 



Coeficientes sin 
estandarizar 

Coeficientes 

estandarizados 



Modelo 

B 

Error estándar 

Beta 

t 

Sig 

1 (Constante) 

35.825 

10.178 


3.520 

.006 

Estpadre 

.476 

.153 

.703 

3.123 

.011 


a Variable dependiente: Esthijo. 


Delante de la palabra (Constante)se encuentra el valor de a 0 y delante de la palabra E s t pa d r e se encuentra el 
valor de 


Tabla 14.2 


X 

Y 

X 2 

X7 

y 2 

65 

68 

4 225 

4 420 

4 624 

63 

66 

3 969 

4 158 

4 356 

67 

68 

4 489 

4 556 

4 624 

64 

65 

4 096 

4 160 

4 225 

68 

69 

4 624 

4 692 

4 761 

62 

66 

3 844 

4 092 

4 356 

70 

68 

4 900 

4 760 

4 624 

66 

65 

4 356 

4 290 

4 225 

68 

71 

4 624 

4 828 

5 041 

67 

67 

4 489 

4 489 

4 489 

69 

68 

4 761 

4 692 

4 624 

71 

70 

5 041 

4 970 

4 900 

O 

O 

co 

II 

>< 

w 

i—1 
i—1 

CO 

II 

W 

£ X 2 = 53 418 

£X7 =54 107 

£ y 2 = 54 849 


c) La recta de regresión deX sobre Y esX = b 0 + b^Y, donde Jb 0 y b x se obtienen resolviendo las ecuaciones normales 

£ X = b 0 N + b\ £ Y 
J2XY = b 0 J2 Y + b\ £ Y 2 

Empleando las sumas de la tabla 14.2 estas ecuaciones son: 

12¿b + 8116,= 800 

8116b+ 54 8496, = 54 107 
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de las cuales se encuentra que t) 0 = -3.38 y b 1 = 1.036, por lo queX = -3.38 + 1.036/ 

A continuación se presenta parte del resultado que se obtiene con la secuencia St ati stics —>Li near models ^ 
Linear regresi ón de STATI ST IX: 

Statistix 8.0 

Unweighted Least Squares Linear Regression of Htfather 
Predic t o r 

Variable Coefficient Std Error T P 

Constant -3.37687 22.4377 -0.15 0.8834 

Htson 1.03640 0.33188 3.12 0.0108 

Delante déla palabrac o n s t ant se encuentra el valor ¿> 0 = -3.37687 y delante de la palabra E s t hijo se encuen¬ 
tra el valoría = 1.0364. 

14.2 Resolver el problema 14.1 usando M INITAB. Construir tablas en las que se den los valores ajustados, / est , y 
los residuales. Encontrar la suma de los cuadrados de los residuales correspondientes a estas dos rectas de 
regresión. 

SOLUCIÓN 

Primero se hallará la línea de regresión por mínimos cuadrados de V sobreX. A continuación se muestran parte de los 
resultados que da M INITAB. En la tabla 14.3 se dan los valores ajustados, los residuales y los cuadrados de los residuales 
correspondientes a la línea de regresión de V sobreX. 


Tabla 14.3 


X 

/ 

Valor ajustado 

^est 

Residual 

y - ^est 

Cuadrado del 
residual 

65 

68 

66.79 

1.21 

1.47 

63 

66 

65.84 

0.16 

0.03 

67 

68 

67.74 

0.26 

0.07 

64 

65 

66.31 

-1.31 

1.72 

68 

69 

68.22 

0.78 

0.61 

62 

66 

65.36 

0.64 

0.41 

70 

68 

69.17 

-1.17 

1.37 

66 

65 

67.27 

-2.27 

5.13 

68 

71 

68.22 

2.78 

7.74 

67 

67 

67.74 

-0.74 

0.55 

69 

68 

68.69 

-0.69 

0.48 

71 

70 

69.65 

0.35 

0.12 




Suma = 0 

Suma = 19.70 


MTB > Regress 'Y' on 1 predi c t o r 'X' 

Análisis de regresión 

La ecuación de regresión es Y = 35.8 + 0.476 X 

El resultado que da M INITAB al hallar la línea de regresión por mínimos cuadrados deX sobre Y es el siguiente: 

MTB > Regress 'X' on 1 predictor 'Y' 

Análisis de regresión 

La ecuación de regresión es X = -3.4 + 1.04 Y 

En la tabla 14.4 se dan los valores ajustados, los residuales y los cuadrados de los residuales correspondientes a la 
línea de regresión deX sobre/. 
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Tabla 14.4 


X 

y 

Valor ajustado 

*est 

Residual 

X-X est 

Cuadrado del 
residual 

65 

68 

67.10 

-2.10 

4.40 

63 

66 

65.03 

-2.03 

4.10 

67 

68 

67.10 

-0.10 

0.01 

64 

65 

63.99 

0.01 

0.00 

68 

69 

68.13 

-0.13 

0.02 

62 

66 

65.03 

-3.03 

9.15 

70 

68 

67.10 

2.90 

8.42 

66 

65 

63.99 

2.01 

4.04 

68 

71 

70.21 

-2.21 

4.87 

67 

67 

66.06 

0.94 

0.88 

69 

68 

67.10 

1.90 

3.62 

71 

70 

69.17 

1.83 

3.34 




Suma = 0 

Suma = 42.85 


Comparando la suma de cuadrados de los residuales se ve que el ajuste de la recta de regresión de mínimos cuadra¬ 
dos de y sobreX es mucho mejor que el ajuste de la recta de regresión de mínimos cuadrados deX sobre y. Recuérdese que 
cuanto menor sea la suma de los cuadrados de los residuales, el modelo de regresión se ajusta mejor a los datos. La estatu¬ 
ra del padre es mejor predictor de la estatura del hijo que la estatura del hijo de la estatura del padre. 

ERROR ESTÁNDAR DE ESTIMACIÓN 

14.3 Si la línea de regresión de Y sobreX está dada por y = a 0 + a^, probar que el error estándar de estimación 
Syj está dado por 

2 _ E T 2 - a 0 £ Y - ai £ XY 


SOLUCIÓN 

Los valores estimados para y, de acuerdo con la línea de regresión, están dados por y est = a 0 + a x X. Por lo tanto, 

¿ = E {Y- Test) 2 = Z(Y~g 0 - ai X) 2 

= E Y (Y -a 0 -ci x X) - a 0 E(T- g 0 - a\X) - ci\ E X ( Y -a ü - a x X) 

N 

Pero J2(Y-a 0 -a i X) = j:Y-a 0 N-a l j:x = 0 

y Y.X{Y-a ü -a x X) = Y,XY-a 0 Y.X-a x Y.X 2 =0 

ya que de acuerdo con las ecuaciones normales 

E Y = a 0 N + c'i E % 

E yy = a 0 E -T + ai E ^ 2 

. 2 E Y(Y - a 0 - a x X) E Y 2 -a 0 E Y - a x T, XY 

Por lo tanto, s 2 yx = —— --- = ^ - 

N N 


Este resultado puede extenderse a ecuaciones de regresión no lineales. 
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14.4 S\x = X-Xyy=Y-Y, mostrar que la ecuación del problema 14.3 puede expresarse 

2 ^ E v 2 - a \ E x y 


SOLUCIÓN 

De acuerdo con el problema 14.3, s\ X = x + X y Y = y+ Y, se tiene 

Xs^.x = E 1 ~ fl o E Y — a x 53 XY = E (X + Y)~ — a 0 53 (y + Y) — a x 53 (•* + X)(y + Y) 

= 53 (y 2 + 2yY+ Y 1 ) - fl 0 (E y + XY) - a, E (xy + Xy + xY + XY ) 

= E / + 2? E y + XY 2 - a 0 NY - a x E xy - a¡X E - «i Y E * - a,NXY 
= E / + XY 2 - a 0 NY -a { E xy - aiNXY 
= E y 2 - a i E xy + XY(Y - a 0 - a\X) 

= E / -«iE^ 

donde se han empleado los resultados E x = 0, E >’ = 0 Y ^ = a o + a \X (que se obtienen al dividir entre N ambos lados 
de la ecuación normal E Y = a 0 N + a x E X por N). 


14.5 Dados los datos del problema 14.1, calcular el error estándar de estimación s YX empleando: a) la definición y 
b) la ecuación obtenida en el problema 14.4. 

SOLUCIÓN 


a) De acuerdo con el problema 14.1b), la recta de regresión de y sobre X es Y = 35.82 + 0.476X. En la tabla 14.5 sedan 
los valores reales de y (tomados delatadla 14.1) y los valores estimados de y, que se denotan y est , obtenidos emplean¬ 
do la recta de regresión; por ejemplo, para X = 65 se tiene y est = 35.82 + 0.476(65) = 66.76. También se dan los 
valores Y - Y^, que se necesitan para calcular s yx : 

2 _E(^-í r est)_(1.24) 2 + (0.19) 2 + ... + (0.38) 2 _ 1 _ 


Y s y.x = Vi.1642 = 1.28 in. 
b ) De acuerdo con los problemas 14.1,14.2 y 14.4 


E/-fliE^_ 38.92 - 0.476(40.34) 

Ñ “ 12 


1.643 


y s y.x = Vi-643 = 1.28 in. 


Tabla 14.5 


X 

65 

63 

67 

64 

68 

62 

70 

66 

68 

67 

69 

71 

y 

68 

66 

68 

65 

69 

66 

68 

65 

71 

67 

68 

70 

^est 

66.76 

65.81 

67.71 

66.28 

68.19 

65.33 

69.14 

67.24 

68.19 

67.71 

68.66 

69.62 

y - ^est 

1.24 

0.19 

0.29 

-1.28 

0.81 

0.67 

-1.14 

-2.24 

2.81 

-0.71 

-0.66 

0.38 


14.6 a) Construir dos rectas que sean paralelas a la recta de regresión del problema 14.1 y que se encuentren a una 
distancia vertical s Y X de ella. 

b) Determinare! porcentaje de los datos que caen entre estas dos líneas. 
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SOLUCIÓN 



F ¡gura 14-3 De los datos, el 66% se encuentra a una distancia no mayor a S YJ( de la línea de regresión. 

a) La recta de regresión Y = 35.82 + 0.476X, obtenida en el problema 14.1, es la recta que aparece marcada con los 
rombos. Es la recta deenmedlo délas tres rectas que aparecen en la figura 14-3; hay otras dos rectas que se encuentran 
cada una a una distancia S r x = 1.28 de la recta de regresión. A estas rectas se les llama rectas Inferior y superior. 

b ) En la figura 14-3, los datos aparecen como círculos en negro. Ocho de los 12 datos, es decir el 66.7%, se encuentran en¬ 
tre las rectas inferior y superior. Dos datos se encuentran fuera de estas rectas y otros dos se hallan sobre estas rectas. 

VARIACIÓN EXPLICADAY VARIACIÓN NO EXPLICADA 

14.7 Probar que £(7- F) 2 = £ (Y - F est ) 2 + £ (F est - Y) 2 . 

SOLUCIÓN 

Elevando al cuadrado ambos lados de Y — Y = (Y — F est ) + (F est - Y) y sumando después, se tiene 

E (Y - Yf = Y. (Y - F est ) 2 + E (Test - Y) 2 + 2 £ {Y - F est )(F est - F) 

La ecuación buscada se obtiene Inmediatamente si se demuestra que la última suma es cero; en el caso de la regresión lineal, 
esto es así debido a que 

E (Y - F est )(F est - Y) = {Y - a 0 - a^X)(a 0 + a¡X - F) 

= a 0 EíF-flo-fli^ + fl! E^(F — «o - «1^0- FE(F—fl 0 —«i^)=0 

y por las ecuaciones normales, (F - a 0 - a¡X) = OyE^ r (F-a 0 - a x X) = 0. 

De Igual manera, empleando la curva de mínimos cuadrados dada por F est = a 0 + a x X + a 2 X 2 h- 1 - a„X n , puede 

mostrarse que este resultado también es válido para la regresión no lineal. 

14.8 Dados los datos del problema 14.1, calcular: a) la variación total, b) la variación no explicada y c) la variación 
explicada. 

SOLUCIÓN 

La recta de regresión por mínimos cuadrados es y est = 35.8 + 0.476X. En la tabla 14.6 se ve que la variación total 
= E ( Y - Y) 2 = 38.917, la variación no explicada = E ( Y - F est ) 2 = 19.703 y la variación explicada = E (F est - Y) 1 
= 19.214. 
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Tabla 14.6 


Y 

^est 

(Y - F) 2 

- y e st) 2 

(Yest-Y ) 2 

68 

66.7894 

0.1739 

1.46562 

0.62985 

66 

65.8366 

2.5059 

0.02669 

3.04986 

68 

67.7421 

0.1739 

0.06650 

0.02532 

65 

66.3130 

6.6719 

1.72395 

1.61292 

69 

68.2185 

2.0079 

0.61074 

0.40387 

66 

65.3602 

2.5059 

0.40930 

4.94068 

68 

69.1713 

0.1739 

1.37185 

2.52257 

65 

67.2657 

6.6719 

5.13361 

0.10065 

71 

68.2185 

11.6759 

7.73672 

0.40387 

67 

67.7421 

0.3399 

0.55075 

0.02532 

68 

68.6949 

0.1739 

0.48286 

1.23628 

70 

69.6476 

5.8419 

0.12416 

4.26273 

y = 67.5833 


Suma = 38.917 

Suma = 19.703 

Suma = 19.214 


Los siguientes resultados de M INITAB dan las mismas sumas de cuadrados. Estas sumas aparecen en negritas. 
Obsérvese la enorme cantidad de cálculos que este software le ahorra al usuario. 

MTB > Regr ess 'Y' 1 'X'; 

SUBO Const ant ; 

SUBO Br i ef 1. 

Análisis de regresión 

The regression equation is 
Y = 35.8 + 0.476 X 


An a I ysi s of Va r i a n c e 


So u r c e 

DF 

SS 

MS 

F 

P 

Regr es s1 on 

1 

19.214 

19.214 

9.75 

0.011 

Residual Error 

10 

19. 703 

1.970 



Total 

11 

38. 917 





COEFICIENTE DE CORRELACIÓN 

14.9 Usar los resultados del problema 14.8 para hallar: a) el coeficiente de determinación y b) el coeficiente de 
correlación. 


SOLUCIÓN 


a) 

b ) 


Coeficiente de determinación = r 2 


variación explicada 
variación total 


19.214 

38.917 


0.4937 


Coeficiente de correlación = r = ±\/0.4937 = ±0.7027 

ComoX y Y se relacionan en forma directa, se elige el signo positivo. A dos lugares decimales r = 0.70. 


14.10 Probar que para la regresión lineal, el coeficiente de correlación entre las variables X y Y puede expresarse 
como 


E x >' 


V(E * 2 )(E /) 


donde x = X- X y y= Y - Y. 
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SOLUCIÓN 


La recta de regresión por mínimos cuadrados de Y sobreX puede expresarse y est = a 0 + a x X o bien y est 
problema 13.15a)] 


Entonces 


Y' XV 

«I = ^r~2 y Test = T est - Y 

E * 

^2 variación explicada 3 ; est 

variación total ( y — Y ) 2 E X 2 

E c/jv 2 a¡ E x 2 /E-vvV E-V 2 (Etv ) 2 

Er E.v 2 IeW E.v 2 (E-v 2 )(E.v 2 ) 


y 


/• = ± 


E *x 

V(E * 2 )(E v 2 ) 


a x x, donde [ver 


Sin embargo, como la cantidad 


E *y 

V(E * 2 )(E i’ 2 ) 


es positiva cuandoy est aumenta a medida quex aumenta (es decir, correlación lineal positiva) y negativa cuando y est dismi¬ 
nuye a medida quex aumenta (es decir, correlación lineal negativa), esta expresión tiene automáticamente el signo correc¬ 
to. Por lo tanto, el coeficiente de correlación lineal se define como 


r 


E-*x 

V(E * 2 )(E x 2 ) 


A esta expresión se le conoce como fórmula producto-momento para el coeficiente de correlación lineal. 


FÓRMULA PRODUCTO-MOMENTO PARA EL COEFICIENTE 
DE CORRELACIÓN LINEAL 


14.11 Encontrar el coeficiente de correlación lineal entre las variablesX y Y que se presentan en la tabla 14.7. 

Tabla 14.7 


X 

1 

3 

4 

6 

8 

9 

11 

14 

Y 

1 

2 

4 

4 

5 

7 

8 

9 


SOLUCIÓN 


Para facilitar los cálculos se elabora la tabla 14.8. 

E xy _ 84 

' “ V(E-v 2 )(E X 2 ) “ V032)(56) 


0.977 


Esto indica que existe una correlación lineal muy elevada entre estas variables, como ya se observó en los problemas 
13.8 y 13.12. 


Tabla 14.8 


X 

Y 

1 

II 

X 

I 

II 

X 2 

xy 

y 2 

1 

1 

-6 

-4 

36 

24 

16 

3 

2 

-4 

-3 

16 

12 

9 

4 

4 

-3 

-1 

9 

3 

1 

6 

4 

-1 

-1 

1 

1 

1 

8 

5 

1 

0 

1 

0 

0 

9 

7 

2 

2 

4 

4 

4 

11 

8 

4 

3 

16 

12 

9 

14 

9 

7 

4 

49 

28 

16 

E^ = 56 

X = 56/8 = 7 

E T = 40 

7 = 40/8 = 5 



Ex 2 = 132 

E x y = 84 

E X 2 = 56 
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14.12 Con objeto de investigar la relación entre el promedio de calificaciones y la cantidad de horas por semana que 
se vetelevisión, se recolectan los datos que se muestran en latabla 14.9 y en la fi gura 14-4, y se emplea EXCEL 
para obtener un diagrama de dispersión de los datos. La información corresponde a 10 estudiantes de secunda¬ 
rla, X es la cantidad de horas por semana que el estudiante vetelevisión (horas de TV) y Y es su promedio de 
calificaciones. 


Tabla 14.9 


Horas deTV 

Promedio de calificaciones 

20 

2.35 

5 

3.8 

8 

3.5 

10 

2.75 

13 

3.25 

7 

3.4 

13 

2.9 

5 

3.5 

25 

2.25 

14 

2.75 



15 20 

Horas de TV 

Figura 14-4 EXCEL, diagrama de dispersión de datos del problema 14.12. 


Usar EXCEL para calcular el coeficiente de correlación de estas dos variables y verificar empleando la 
fórmula de producto-momento. 

SOLUCIÓN 

Para hallar el coeficiente de correlación se emplea la función de EXCEL =C 0 R R E L ( E 2 : Eli, F2: F 11 ) , ingresando 
en las celdas E 2 : Eli las horas de televisión y en las celdas F 2 : F 11 los promedios de calificaciones. El coeficiente de 
correlación es -0.9097. El signo negativo indica que las dos variables están inversamente correlacionadas. Es decir, cuan¬ 
to mayor es la cantidad de horas que se ve televisión, menor es el promedio de calificaciones. 

14.13 En un estudio se registran los salarlos Iniciales (en miles), Y, y los años de estudio, X, de 10 empleados. En la 
tabla 14.10 y en la figura 14-5 se presentan los datos y una gráfica de dispersión empleando SPSS. 
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Tabla 14.10 


Salarlo Inicial 

A ños de estudio 

35 

12 

46 

16 

48 

16 

50 

15 

40 

13 

65 

19 

28 

10 

37 

12 

49 

17 

55 

14 


60.00 


g 50.00 
’S 

.o 

M 

& 40.00 


30.00 


12.00 15.00 18.00 

Estudios 

Figura 14-5 SPSS, diagrama de dispersión del problema 14.13. 



Usar SPSS para calcular el coeficiente de correlación de estas dos variables y verificar usando la fórmu¬ 
la del producto-momento. 

SOLUCIÓN 


Correlaciones 



salario inicial 

estudios 

salario inicial Correlación de Pearson 

1 

.891** 

Sig. (2 colas) 


.001 

N 

10 

10 

estudios Correlación de Pearson 

.891** 

1 

Sig. (2 colas) 

.001 


N 

10 

10 


**Correlación significativa al nivel 0.001 (2 colas). 
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La secuencia Analyze ->Correlate —>Bi vari ate de SPSS da la correlación empleando la fórmula del 
producto-momento. A esta fórmula también se le llama correlación de Pearson. 

El resultado da el coeficiente de correlación r = 0.891. 

14.14 En un estudio realizado con 10 estudiantes se registró la cantidad de horas por semana que emplean su teléfo¬ 
no celular, Y, y la cantidad de letras en su nombre, X. En la tabla 14.11 y en la figura 14-6 se presentan los datos 
y el diagrama de dispersión obtenido con STATISTIX. 


Tabla 14.11 


Horas de celular 

Letras en el nombre 

6 

13 

6 

11 

3 

12 

17 

7 

19 

14 

14 

4 

15 

4 

3 

13 

13 

4 

7 

9 


Diagrama de dispersión de letras VS. horas 



Figura 14-6 STATISTIX, diagrama de dispersión de los datos de la tabla 14.11. 


Usar STATISTIX para calcular el coeficiente de correlación de las dos variables y verificar usando la 
fórmula del producto-momento. 

SOLUCIÓN 

Con la secuencia "Statistics — > L i n e a r models —>correl ati ons( Pearson) " se obtiene el resultado 
siguiente: 

Statistix 8.0 

Correl ations (Pearson) 

Hours 

Letters -0.4701 

P-VALUE 0.1704 
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El coeficiente de correlación es r = -0.4701. Entre estas dos variables no existe una correlación signi¬ 
ficativa. 

14.15 Mostrar que el coeficiente de correlación lineal está dado por 

r _ *E*r-(E*)(E y ) 

\J WJ2x 2 - (¿2 X) 2 }[NEY 2 -(E F) 2 ] 


SOLUCIÓN 

Si se escribe x = X - X y y = Y - Y &\\d, fórmula del problema 14.10, se tiene 

r _ E*y _ E (x-x)(y-y) 

V(E-v 2 )(E v 2 ) ^E(jr-jr) 2 ]E(F-f) 2 ] 

Pero - X)(Y - Y) =J2 (XY - XY - XY + X?) = J2XY-XJ2 Y-Y E X + NXY 

= J2 XY - NXY - NYX + NXY = £ A'F - NXY 

(E *)(E y) 


(34) 


= E XY - - 


N 


ya que X = (E X)/N y T = (E F)/AT. De igual manera, 

¿2 (Y - X) 2 = £ (X 2 - 2JVX + -F 2 ) = E -T 2 - 2X J2 X + NX 2 

E jY 2 2(E ^Y) 2 | (E ^) 2 E jY 2 (E ^) 2 


IV 


AT 


TV 


J2(y- f) 2 = E f 2 --^ F) 


TV 


Por lo tanto, la ecuación (34) se convierte en 

£XF-(£X)(£ Y)/N 


^ETF-(E *xe y) 


0E F 2 - (E *) 2 /^][E f 2 - (E F) 2 /Aq y/[N E f 2 - (£ xf\[N E t 2 - (E f) 2 ] 


14.16 Se estudió la relación entre el exceso de peso y la presión sanguínea alta en adultos obesos. En la tabla 14.12 
se presentan exceso de peso, en libras, y unidades superiores a 80 en la presión diastólica. En la figura 14-7 se 
presenta el diagrama de dispersión obtenido con SAS. 


Tabla 14.12 


Exceso de peso en libras 

U nidades superiores a 80 

75 

15 

86 

13 

88 

10 

125 

27 

75 

20 

30 

5 

47 

8 

150 

31 

114 

78 

68 

22 
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40 - 


30 - 


20 - 


10 - 


0 - 

30 40 50 60 70 80 90 100 110 120 130 140 150 


Exceso de peso 

Figura 14-7 SAS, diagrama dedispersión para el problema 14.16. 


U sar SA S para calcular el coeficiente de correlación de estas dos variables y verificar usando la fórmula del pro¬ 
ducto-momento. 

SOLUCIÓN 

Con la secuencia Statistics —> Descriptive^ Correlations de SAS se obtiene el procedimiento para la correlación, una 
parte del cual se muestra a continuación. 


The CORR Pr oc ed u r e 
Ov e r wt 

Over wt 1.0 0 0 0 0 

Ov e r wt 

Over 8 0 0.8 5 5 3 6 

Over 8 0 0.0 0 1 6 


Over 80 
0.85536 
0.0016 
1.00000 


El coeficiente de correlación dado en estos resultados es 0.85536. Existe una correlación significativa entre el 
exceso de peso de una persona y una presión diastólica superior a 80. 


COEFICIENTE DE CORRELACIÓN PARA DATOS AGRUPADOS 

14.17 En la tabla 14.13 se muestran las distribuciones de frecuencias de las calificaciones finales en matemáticas y 
en física de 100 estudiantes. De acuerdo con esta tabla determinar. 

a) El número de estudiantes que en matemáticas obtuvo una calificación entre 70 y 79, y en física una califi¬ 
cación entre 80 y 89. 

b) El porcentaje de estudiantes cuya calificación en matemáticas es menor a 70. 

c) El número de estudiantes que tiene 70 o más en física y menos de 80 en matemáticas. 

d) El porcentaje de estudiantes que aprueba por lo menos una de estas dos materias, suponiendo que la cali¬ 
ficación para aprobar es 60. 
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SOLUCIÓN 

a) En la tabla 14.13 se desciende por la columna cuyo encabezado es 70-79 (calificación en matemáticas) hasta el renglón 
marcado 80-89 (calificación en física), donde la entrada es 4, que es el número de estudiantes buscado. 


Tabla 14.13 



Calificación en matemáticas 

40-49 

50-59 

60-69 

70-79 

80-89 

90-99 

Total 


90-99 




2 

4 

4 

10 

Cal if i caci ón en físi ca 

80-89 



1 

4 

6 

5 

16 

70-79 



5 

10 

8 

1 

24 

60-69 

1 

4 

9 

5 

2 


21 

50-59 

3 

6 

6 

2 



17 

40-49 

3 

5 

4 




12 

Total 

7 

15 

25 

23 

20 

10 

O 

O 

i—1 


b ) El número de estudiantes cuya calificación en matemáticas es menos de 70 es el número de estudiantes cuya califica¬ 
ción corresponde a 40-49 + el número de estudiantes cuya calificación está en 50-59 + el número de estudiantes cuya 
calificación se halla en 60-69 = 7 + 15 + 25 = 47. Por lo tanto, el porcentaje buscado es 47/100 = 47%. 

c) El número buscado de estudiantes es la suma de las entradas en la tabla 14.14 (que presenta parte de las entradas de 
la tabla 14.13). Por lo tanto, el número buscado de estudiantes es 1 + 5 + 2 + 4 + 10 = 22. 

d) En la tabla 14.15 (tomada de la tabla 14.13) se muestra el número de alumnos que tiene una calificación menor a 60 
en física o en matemáticas o en ambas materias, que es 3 + 3 + 6 + 5 = 17. Por lo tanto, el número de estudiantes 
con una calificación de 60 o más en física o en matemáticas, o en ambas, es 100 - 17 = 83. El porcentaje buscado es 
83/100 = 83%. 


Tabla 14.14 



Calificaciones en 
matemáticas 

60-69 

70-79 

Calificaciones 
en física 

90-99 


2 

80-89 

1 

4 

70-79 

5 

10 


Tabla 14.15 



Calificaciones en 
matemáticas 

40-49 

50-59 

Calificaciones 
en física 

50-59 

3 

6 

40-49 

3 

5 


La tabla 14.13 a veces se denomina tabla de frecuencias bivariada o distribución de frecuencias bivariada. Cada 
cuadro de la tabla se llama celda y corresponde a un par de clases o intervalos de clase. El número indicado en la celda se 
conoce como frecuencia de celda. Por ejemplo, en la partea) el número 4 es la frecuencia de la celda que corresponde al 
par de intervalos de clase 70-79 en matemáticas y 80-89 en física. 

Los totales indicados en la última fila y la última columna se denominan totales marginales o frecuencias margina¬ 
les. Corresponden, respectivamente, a las frecuencias de clase de las distribuciones de frecuencias separadas de las califi¬ 
caciones de matemáticas y de física. 
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14.18 M ostrar cómo modificar la fórmula del problema 14.15 en el caso de datos agrupados, como en la tabla de 
frecuencias bivariada (tabla 14.13). 

SOLUCIÓN 

En el caso de datos agrupados se puede considerar que los valores de las vari ables X y Y coinciden con las marcas de clase 
y que f x y f Y son las correspondientes frecuencias de clase, o frecuencias marginales, que se muestran en el último renglón 
y en la última columna de la tabla de frecuencias blvarlada. Si f representa las diversas frecuencias de celda que correspon¬ 
den a los pares de marcas de clase (X , Y), entonces la fórmula del problema 14.15 puede reemplazarse por la fórmula 

JV£/xr-(ZfxX)(Zfrr) _ [35) 

y/[N £ fxX 2 - (E fxXf] [N £ fyY 2 - (£ /y Y) 2 ] 

SI X = A + c x ti x yY = B + c Y u Y , dondec x y c Y son las amplitudes de los intervalos de clase (que se suponen cons¬ 
tantes) y A y 6 son dos marcas de clase cualesquiera que corresponden a estas variables, la fórmula (35) se convierte en la 
fórmula (21) de este capítulo: 

r __ N J2 f u x ll Y ~ {J2 fx u x)(J2 Íy u y) _ 

\lwj2fx u x ~ (52, fx u x)~][N Yhfy^Y ~ (£./V M r)~] 

Éste es el método de codificación empleado en capítulos anteriores como método abreviado para el cálculo de medias, 
desviaciones estándar y momentos superiores. 


14.19 Encontrar el coeficiente de correlación lineal correspondiente a las calificaciones de matemáticas y de física 
del problema 14.17. 

SOLUCIÓN 

Se usará la fórmula (21). Para facilitar los cálculos se elabora la tabla 14.16, a la que se le llama tabla de correlación. Las 
sumas £ fx, Yjfxux, Efxiil, I Z/y, YjÍyUy Y £/y“y se obtienen empleando el método de codificación, como en 
capítulos anteriores. 

En la tabla 14.16, el número que aparece en la esquina de cada celda representa el producto fu x u Y , donde fes la 
frecuencia de celda. La suma de estos números de las esquinas en cada renglón se indica en el renglón correspondiente de 
la última columna. La suma de estos números de las esquinas en cada columna se indica en la columna correspondiente del 
último renglón. Los totales finales del último renglón y de la última columna son ¡guales y representan £ fitxuy- 
De acuerdo con la tabla 14.16, se tiene 

r _ _ TV Yhf u X u Y ~~ (J2 fx u x){Yl fY U Y ) _ 

Y \ N J2fxKr ~ (J2 fxUxY]{N J2 Íy u y ~ QD/r«r)‘] 

= (100)( 125) — (64)(—55) = 16 020 = Q ^ 

\J [(100)(236) - (64) 2 ][(100)(253) - (—55) 2 ] V( 19 504)(22 275) 


14.20 Empleando la tabla 14.16 calcular: a) s x , b) s Y y c) s XY y verificar la fórmula r = s XY /(s x s Y ). 

SOLUCIÓN 


a ) s x — c x 

b) Sy Cy 

c) S X y = C X Cy 




too V ioo 7 


64 


^ =13. 


966 


(J2Íy u y 


N 

~ E fi'x 

N 


\ N 




U X U Y _ Í J2 fx u x \ Í J2 Jy 11 y \ 
N \ N )\N ) 


= ( 10 )( 10 ) 


64 \ /—55 


125 


100 Y1007 Y 100 


= 160.20 


Por lo tanto, la desviación estándar de las calificaciones de matemáticas y de física son 14.0 y 14.9, respectivamente, y la 
covarianza es 160.2. Por lo tanto, el coeficiente de correlación r es 
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Tabla 14.16 



Calificaciones en matemáticasX 


X 

44.5 

54.5 

64.5 

74.5 

84.5 

94.5 

fy 

fyUy 

fyUy 

Suma de 
los números 
en las 
esquinas 
de cada 
renglón 

Cal ificaciones en física Y 

Y 

\ P 

Uy \ 

-2 

-1 

0 

1 

2 

3 

94.5 

2 




2 

P 

4 

[16 

4 

F4 

10 

20 

40 

44 

84.5 

1 



1 

P 

4 

P 

6 

\ñ 

5 

PS 

16 

16 

16 

31 

74.5 

0 



5 

P 

10 

P 

8 

P 

1 

P 

24 

0 

0 

0 

64.5 

-1 

1 

[2 

4 

R" 

9 

P 

5 

2 

P 


21 

-21 

21 

-3 

54.5 

-2 

3 

ÍI 

6 

P 

6 

¡ '¡0 

2 

P 



17 

-34 

68 

20 

44.5 

-3 

leo 

m 

5 

P 

4 

w 




12 

-36 

108 

33 


fx 

7 

15 

25 

23 

20 

10 

E f x=Z f y 
= N =100 

E f Y U Y 

= -55 

E f Y U Y 

= 253 

E fu x Uy 
= 125 

f X Ux 

-14 

-15 

0 

23 

40 

30 

Zf X U X 

= 64 

C \P 

y* 

y 

f X u 2 x 

28 

15 

0 

23 

80 

90 

Zf x u 2 x 
= 236 

Suma de los 
números en 
las esquinas 
de cada 
columna 

32 

31 

0 

-1 

24 

39 

E fu X Uy 

= 125 


■ — SxY — * 60-20 
' ~ s x s Y ~ (13.966)(14.925) “ ' 

que coincide con el valor obtenido en el problema 14.19. 


RECTAS DE REGRESIÓN Y EL COEFICIENTE DE CORRELACIÓN 

14.21 Probar que las rectas de regresión de Y sobre X y deX sobre Y son, respectivamente, a) Y - Y = ( rs Y /s x ) 
(Y - Y) y b) X - X = ( rs x /sy)(Y - Y). 

SOLUCIÓN 

a) De acuerdo con el problema 13.15a), la ecuación de la recta de regresión de Y sobreX es 

y = ) x 0 bien Y ~ ?= (§5) (jr "' ?) 

, . A ' v . = (ver problema 14.10) 

V / MÉ7) 


Entonces, como 
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b) 


se tiene 


E xy = >V(E -v 2 )(E j' 2 ) _ >'\/E7 
E * 2 E -v 2 VE^ 


de donde resulta la fórmula buscada. 

La fórmula buscada se obtiene Intercambiando X y y en el inciso a). 


rs Y 

sx 


14.22 SI las rectas de regresión de Y sobre X y deX sobre Y son, respectivamente, Y = a 0 + a Y X y X = b 0 + b-¡Y, 
probar que a^! = r 2 . 

SOLUCIÓN 


De acuerdo con el problema 14.21, incisos a) y b), 


rs Y 


y 


, rs y 
b\= - 

S Y 


Sx 

Por lo tanto, a x b x = 

Esta fórmula puede tomarse como el punto de partida para la definición del coeficiente de correlación lineal. 


r Sy \ (rsx 

Sx J \ sy 


14.23 Emplear la fórmula obtenida en el problema 14.22 para hallar el coeficiente de correlación lineal correspon¬ 
diente a los datos del problema 14.1. 

SOLUCIÓN 

De acuerdo con el problema 14.1 [incisos b) y c), respectivamente] a 1 = 484/1 016 = 0.476 y b 1 = 484/467 = 1.036. Por 
lo tanto, Y 2 = a 1 b 1 = (384/1 016)(484/467) y r = 0.7027. 


14.24 Dados los datos del problema 14.19, escribir las ecuaciones de las rectas de regresión de: a) Y sobreX y b) X 
sobre Y. 


SOLUCION 

De acuerdo con la tabla de correlación (tabla 14.16) del problema 14.19, se tiene 

X = A + c x ^- / ^ UX = 64.5 + ^ 1 ° 1 ^ 4 ^ = 70.9 
Y = B + cy X&L = 74.5 + ( 10 ^„~ 55) = 69.0 


N 


100 


De acuerdo con los resultados del problema 14.20, s x = 13.966, s Y = 14.925 y r = 0.7686. Ahora, empleando el problema 
14.21, incisos a) y b), se obtienen las ecuaciones de las rectas de regresión. 

a) Y-Y = —(X-X) Y - 69.0 = (°- 76 ^)(^- 925 ) _ 70 9 ) = q.821(X - 70.9) 


sx 


13.966 


b) X-X = '^±(Y-Y) X-70.9 = ^—^j^^-(Y-69.0) = 0.719(Y-69.0) 


14.25 Dados los datos del problema 14.19, calcular los errores estándar de estimación: a) s YJ y b) s X Y - U sar los resul¬ 
tados del problema 14.20. 

SOLUCIÓN 

a) s r .x = syV 1 -r-= 14.925^/ 1 - (0.7686) 2 = 9.548 

b) sx.y = sx '/1 - r 2 = 13.966^/1 - (0.7686) 2 = 8.934 
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14.26 En latabla 14.17 se presentan los índices de precios al consumidor para alimentosy atención médica, deEstados 
U nidos, desde 2000 hasta 2006, comparados con los precios de los años base, 1982 a 1984 (tomando la media 
como 100). Calcular el coeficiente de correlación entre estos dos índices de precios y dar el cálculo de este 
coeficiente empleando M INITAB. 


Tabla 14.17 


Año 

2000 

2001 

2002 

2003 

2004 

2005 

2006 

Alimentos 

167.8 

173.1 

176.2 

180.0 

186.2 

190.7 

195.2 

M edicamentos 

260.8 

272.8 

285.6 

297.1 

310.1 

323.2 

336.2 


F uente: B ureau of L abor Statistics. 


SOLUCIÓN 

Estos índices para alimentos y para atención médica se denotan X y Y, respectivamente, y los cálculos del coeficiente de 
correlación se organizan en latabla 14.18. (Obsérvese que el año se usa únicamente para especificar los valores correspon¬ 
dientes a X y Y.) 


Tabla 14.18 


X 

Y 

II 

* 

l 

1 

>1 

II 

X 2 

xy 

y 2 

167.8 

260.8 

-13.5 

-37.2 

182.25 

502.20 

1 383.84 

173.1 

272.8 

-8.2 

-25.2 

67.24 

206.64 

635.04 

176.2 

285.6 

-5.1 

-12.4 

26.01 

63.24 

153.76 

180.0 

297.1 

-1.3 

-0.9 

1.69 

1.17 

0.81 

186.2 

310.1 

4.9 

12.1 

24.01 

59.29 

46.41 

190.7 

323.2 

9.4 

25.2 

88.36 

236.88 

635.04 

195.2 

336.2 

13.9 

38.2 

193.21 

530.98 

1 459.24 

JP = 181.3 

Y = 298.0 



Suma = 582.77 

Suma = 1 600.4 

Suma =4 414.14 


Entonces, mediante la fórmula del producto-momento 


J2 x y _ 1 600.4 

V(£ -* 2 )(£ /) = v/(582.77)(4 4141?) 


0.998 


Después de ingresar los valores deX en C1 y los valores de Y en C2, con el comando deMINITAB correl ati on C1 
C 2 , se obtiene el coeficiente de correlación, que es igual al calculado antes. 

Correl ati ons: X, Y 

Pearson correl ati on of X and Y =0.998 
P-Val ue =0. 000 


CORRELACIÓN NO LINEAL 

14.27 Ajustar una parábola de mínimos cuadrados de la forma Y = a 0 + a : X + a 2 X 2 al conjunto de datos de la tabla 
14.19. Dar también la solución empleando M INITAB. 
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SOLUCIÓN 

Las ecuaciones normales (23) del capítulo 13 son 

*22 Y = a 0 N + a \ 22 X + a 2 ^2 X 1 

£ X7 = a 0 22 X + a\^22 X 1 + ci 2 ^2 X 3 (36) 

22 X~ Y = a 0 £ X~ + a¡ 22 X 3 + a 2 22 Y 4 


Tabla 14.19 


X 

1.2 

1.8 

3.1 

4.9 

5.7 

7.1 

8.6 

9.8 

Y 

4.5 

5.9 

7.0 

7.8 

7.2 

6.8 

4.5 

2.7 


Para facilitar el cálculo de las sumas se elabora la tabla 14.20. Entonces, como N = 8, las ecuaciones normales (36) se 
convierten en 

8a 0 + 42.2a, + 291.2032 = 46.4 

42.2a 0 + 291.20a, + 2 275.35a 2 = 230.42 (37) 

291.20a„ + 2 275.35a, + 18 971.923, = 1 449.00 

Resolviendo, a 0 = 2.588, a, = 2.056 y a 2 = -0.2110, de manera que la ecuación de la parábola de mínimos cuadrados 
buscada es 

Y = 2.588 + 2.06527 - 0.2110Z 2 


Tabla 14.20 


X 

Y 

X 2 

X 3 

X 4 

XY 

X 2 Y 

1.2 

4.5 

1.44 

1.73 

2.08 

5.40 

6.48 

1.8 

5.9 

3.24 

5.83 

10.49 

10.62 

19.12 

3.1 

7.0 

9.61 

29.79 

92.35 

21.70 

67.27 

4.9 

7.8 

24.01 

117.65 

576.48 

38.22 

187.28 

5.7 

7.2 

32.49 

185.19 

1 055.58 

41.04 

233.93 

7.1 

6.8 

50.41 

357.91 

2 541.16 

48.28 

342.79 

8.6 

4.5 

73.96 

636.06 

5 470.12 

38.70 

332.82 

9.8 

2.7 

96.04 

941.19 

9 223.66 

26.46 

259.31 

£X 

E Y 

£X 2 

£X 3 

£X 4 

£X Y 

EX 2 / 

= 42.2 

= 46.4 

= 291.20 

= 2 275.35 

= 18 971.92 

= 230.42 

= 1 449.00 


Los valores de Y se ingresan en C1, los valores deX se Ingresan en C2, y los valores deX 2 se Ingresan en C3. Se da la 
secuencia St at — > R e g r e s i ón —> Re gr es s i on deMINITAB. La parábola de mínimos cuadrados dada como parte de 
los resultados es la siguiente: 

La ecuación de regresión es Y = 2.59 + 2.06 X - 0.211 Xcuadrada 
Que es la misma ecuación obtenida resolviendo las ecuaciones normales. 


14.28 Usar la parábola de mínimos cuadrados del problema 14.27 para estimar el valor de Y para los valores dados 
deX. 
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SOLUCIÓN 

Para X = 1.2, y est = 2.588 + 2.065(1.2) - 0.2110(1.2) 2 = 4.762. Los demás valores estimados se obtienen de manera 
similar. Los resultados se muestran en la tabla 14.21 junto con los valores reales de Y. 


Tabla 14.21 


^est 

4.762 

5.621 

6.962 

7.640 

7.503 

6.613 

4.741 

2.561 

y 

4.5 

5.9 

7.0 

7.8 

7.2 

6.8 

4.5 

2.7 


14.29 a) Encontrar el coeficiente de correlación lineal entre las variablesX y V del problema 14.27. 

b) Encontrar el coeficiente de correlación no lineal entre las variables X y Y del problema 14.27, asumiendo 
la relación parábolica obtenida en el problema 14.27. 

c) Explicar la diferencia entre los coeficientes de correlación obtenidos en los incisos a) y b). 

d) ¿Qué porcentaje de la variación total queda no explicada si se supone que la relación entreX y y es la 
relación parabólica? 


SOLUCIÓN 

a) Empleando los cálculos ya realizados en la tabla 14.20 y el hecho de que Y Y 2 = 290.52, se encuentra que 

n Y XY - (E -T)(E y) 

- (E Z ) 2 ][^E t 2 - (E t) 2 ] 

s (8) (230.42)- (42.2) (46.4) = _ Q 3?43 

^/[(8)(291.20) - (42.2) 2 ][(8)(290.52) - (46.4) 2 ] 

b) De acuerdo con la tabla 14.20, Y = (Y Y)/N = 46.4/8 = 5.80; por lo tanto, la variación total es Y ( Y ~ F) 2 = 
21.40. De acuerdo con la tabla 14.21, la variación explicada es Y (T est - F) 2 = 21.02. Por lo tanto, 


r 2 


variación explicada 
variación total 


21.02 

21.40 


0.9822 


y 


r =0.9911 o bien 0.99 


c) El hecho de que en el inciso a) la correlación lineal sea de sólo -0.3743 indica que prácticamente no hay ninguna 
relación lineal entreX y Y. Sin embargo, hay una muy buena relación no lineal dada por la parábola del problema 
14.27, como lo indica el hecho de que en el inciso b ) el coeficiente de correlación sea 0.99. 


d) 


Variación no explicada ■> 

- - -= 1 - r 2 = 1 - 0.9822 = 0.0178 

Variación total 


Por lo tanto, 1.78% de la variación total queda no explicada. Esto puede deberse a fluctuaciones aleatorias o a otras 
variables que no hayan sido tomadas en consideración. 


14.30 Dados los datos del problema 14.27, encontrar: a) s Y y b) s rx . 

SOLUCIÓN 

a) De acuerdo con el problema 14.29a), Y, {Y - Y) 2 = 21.40. Por lo tanto, la desviación estándar de Y es 


s y — 


E {Y-Y ) 2 

N 


21.40 


= 1.636 oblen 1.64 
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b ) Primer método 

Empleando el inciso a) y el problema 14.29b), el error estándar de estimación de y sobreX es 
s Y .x .. ,v Y \ I - r 2 = 1.636i/1 - (0.9911) 2 = 0.218 o bien 0.22 


Segundo método 

Usando el problema 14.29, 


sy.x = 


E (y- r a 

N 


variación no explicada /21.40 - 21.02 


N 


' = 0.218 oblen 0.22 


Tercer método 

Usando el problema 14.27 y el cálculo adicional = 290.52, se tiene 


- J L -* E y -«Z z ■=! r . 0 . 218 obien 0 .22 


TEORIA MUESTRAL DE LA CORRELACIÓN 

14.31 En una muestra de tamaño 18, el coeficiente de correlación encontrado es 0.32. ¿Puede concluirse, a los nive¬ 
les de significancia: a) 0.05 y b) 0.01, que el coeficiente de correlación poblacional correspondiente difiere de 
cero? 

SOLUCIÓN 

Se debe decidir entre las hipótesis H 0 : p = 0y H 1 : p>0. 

r\JN - 2 0.32/0TE2 , _ 

/ = . = = = 1.35 

Vl ~ r2 y 1 — (0.32) 2 

a) Empleando una prueba de una cola con la distribución de Student al nivel 0.05, H 0 se rechaza si t > t. g5 = 1.75 para 
(18 - 2) = 16 grados de libertad. Por lo tanto, al nivel 0.05, no se rechaza H 0 . 

b) Como al nivel 0.05 no se rechaza H 0 , seguramente tampoco se rechazará al nivel 0.01. 

14.32 ¿Cuál será el mínimo tamaño de muestra necesario para que se pueda concluir, al nivel 0.05, que un coeficien¬ 
te de correlación 0.32 difiere significativamente de cero? 

SOLUCIÓN 

Empleando una prueba de una cola con la distribución de Student al nivel 0.05, el valor mínimo de N debe ser tal que 


0.32 VN - 2 
\/l-(0.32) 2 


2 grados de libertad. Para un 

número infinito de grados de libertad t. 95 = 1.64 y por lo tanto, N = 25.6. 

Para N = 26: 

iv = 24 

t-95 = 1-71 

t = 0.32^24 /\¡ 1 - (0.32) 2 = 1.65 

Para N =27: 

iv = 25 

¿95*1-71 

t = 0.32^25/ -\/ 1 - (0.32) : = 1.69 

Para N =28: 

iv = 26 

¿ 95 = 1-71 

t = 0.32\/26 /y/ 1 - (0.32) 2 = 1.72 


Por lo tanto, el tamaño mínimo de la muestra es N = 28. 
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14.33 En una muestra de tamaño 24, el coeficiente de correlación encontrado es r = 0.75. Al nivel de significancia 
0.05, ¿se puede rechazar la hipótesis de que el coeficiente de correlación poblacional sea tan pequeño como: 
a) p = 0.60 y b) p = 0.50? 


SOLUCIÓN 


a) 


y 


Z= 1.1513 log 


n + 0.75\ 
\1 — 0.75/ 


0.9730 


Pz — 


1.1513 log 


/1 + 0.60\ 

Vi o.óoy 


CTZ VN- 3 


-L = 0.2182 

\/2l 


Por lo tanto, 


Z — Pz 
Oz 


0.9730 - 0.6932 
0.2182 


1.28 


0.6932 


Empleando la distribución normal para una prueba de una cola al nivel de significancia 0.05, la hipótesis sólo se podrá 
rechazar si z es mayor que 1.64. Por lo tanto, en este caso no se puede rechazar la hipótesis de que el coeficiente de 
correlación poblacional sea tan pequeño como 0.60. 

b ) Si p = 0.50, entonces p z = 1.1513 log 3 = 0.5493 y z = (0.9730 - 0.5493)/0.2182 = 1.94. Por lo tanto, la hipótesis 
de que el coeficiente de correlación poblacional sea tan pequeño como p = 0.50 al nivel 0.05 puede rechazarse. 


14.34 Se calcula que el coeficiente de correlación entre las calificaciones finales en física y matemáticas de un grupo 
de 21 estudiantes es 0.80. Encontrar límites de confianza de 95% para este coeficiente. 

SOLUCIÓN 

Como r = 0.80 y N = 21, los límites de confianza del 95% para p z están dados por 

Z± 1.96ct z = 1.1513 log (j-^J ± 1-96^ 1 .= j = 1.0986 ± 0.4620 

Por lo tanto, p z tiene el intervalo de confianza de 95% siguiente: 0.5366 a 1.5606. A hora, si 

Pz = 1.1513 log (j~) = 0.5366 entonces p = 0.4904 

y si p z = 1.15131og + p \ = 1.5606 entonces p = 0.9155 

Por lo tanto, los límites de confianza de 95% para p son 0.49 y 0.92. 


14.35 A partir dedos muestras de tamaño N 1 = 28 y N 2 = 35 se obtuvieron los coeficientes de correlación r 1 = 0.50 
y r 2 = 0.30, respectivamente. AI nivel de significancia 0.05, ¿existe una diferencia significativa entre estos dos 
coeficientes? 


SOLUCION 


Z! = 1.1513log (fi-'l) = 0.5493 Z, = 1.1513log f 

\1 — r I / “ \1 — r 2 


= 0.3095 


°z,-z 2 - 


1 -4- „ 1 „ = 0.2669 


1 Ni - 3 N 2 - 3 

Se debe decidir entre las hipótesis H 0 : p Zi = p Zi y H i: p Zi # p Zr Bajo la hipótesis H 0 , 


Z, - Z 2 (p Zi - p Z2 ) = 0.5493 - 0.3095 - 0 = ¡# ^ 

Oz, z 2 0.2669 

Empleando la distribución normal para una prueba dedos colas, H 0 se rechazará sólo si z > 1.96 oz < -1.96. Por lo tanto, 
no se puede rechazar H 0 , y se concluye que al nivel de significancia 0.05 los resultados no son notablemente diferentes. 
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TEORÍA MUESTRAL DE LA REGRESIÓN 

14.36 En el problema 14.1 se encontró que la ecuación de regresión de Y sobreX era Y = 35.82 + 0.476X. Al nivel 
de significancia 0.05, probar la hipótesis nula de que el coeficiente de regresión de la ecuación de regresión 
poblacional es 0.180 contra la hipótesis alternativa de que este coeficiente de regresión es mayor a 0.180. 
Realizar esta prueba sin ayuda de un software para estadística, así como con la ayuda de M INITAB. 

SOLUCIÓN 


t 


a i ~ ¿\ 
Sy.x/Sx 


VN-2 


0.476- 0.180 
1.28/2.66 


\X 12 — 2 = 1.95 


como S ráX = 1.28 (calculado en el problema 14.5) y S x = \/{J2 x 2 )/N = ^84.68/12 = 2.66. Empleando una prueba de 
una cola con la distribución de Student al nivel 0.05, la hipótesis de que el coeficiente de regresión es 0.180 se rechazará si 
t > t 95 = 1.81 para (12 - 2) = 10 grados de libertad. Por lo tanto, se rechaza la hipótesis nula. 

Los resultados de M INITAB para este problema son los siguientes: 


MTB > Regr ess 'Y' 1 'X’; 
SUBO Const ant; 

SUBO Predi ct C7. 


Análisis de regresión 


La ecuación 

de regresión 

e s 




Y = 35.8 + 

0.476 X 





Predi ct or 

Coef 


St Dev 

T 

P 

Constant 

35.82 


10.18 

3. 52 

0. 006 

X 

0. 4764 

0 

.1525 

3. 12 

0.011 

S = 1.404 

R-Sq =49.4% 

R - S q (a d j ) 

= 4 4.3% 


Análisis de 

vari anza 





So u r c e 

DF 


SS 

MS 

F 

Regr es si on 

1 

19 

. 214 

19.214 

9.75 

Residual Error 10 

19 

.703 

1.970 


Tot al 

11 

38 

.917 



Predi c t ed Val ues 

F i t St De v F i t 

95. C 

1% Cl 

95. 0% 

Pl 

66.789 0. 

478 (65. 

7 2 4, 

67.855) 

( 6 3.4 8 5, 

70. 094) 

69.171 0. 

650 (67. 

7 2 3, 

70.620) 

( 6 5. 7 2 4, 

72.618) 


El siguiente fragmento de los resultados proporciona la información necesaria para realizar la prueba de hipótesis. 


Predi c t or Coef St Dev T P 

Constant 35.82 10.18 3.52 0.006 

X 0.4764 0.1525 3.12 0.011 

El estadístico de prueba calculado se encuentra como sigue: 


0.4764-0.180 

0.1525 


1.94 


El valor calculado para t, 3. 12, que se muestra en los resultados de M IN ITAB, sirve para probar la hipótesis nula de que 
el coeficiente de regresión es 0. Para probar cualquier otro valor del coeficiente de regresión se necesita hacer un cálculo 
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como el anterior. Para probar que el coeficiente de regresión es 0.25, por ejemplo, el valor calculado para el estadístico de 
prueba será igual a 


0.4764 - 0.25 
0.1525 


1.48 


La hipótesis nula de que el coeficiente de regresión es igual a 0.25 no se rechazará. 


14.37 Encontrar los límites de confianza de 95% para el coeficiente de regresión del problema 14.36. Establecer el 
Intervalo de confianza sin ayuda de un software para estadística, así como con ayuda de M INITAB. 

SOLUCIÓN 


El intervalo de confianza puede expresarse como 


a\ ± 


t 

VN-2 



Por lo tanto, los límites de confianza de 95% para A 1 (obtenidos haciendo t = ±t 975 = ±2.23 para 12 
libertad) están dados por 


2 = 10 grados de 


«i ± 


2.23 

v/12-2 



0.476 ± 


2.23 

vTo 



0.476 ±0.340 


Es decir, se tiene una confianza de 95% de queA 7 se encuentre entre 0.136 y 0.816. 

En el siguiente fragmento de los resultados obtenidos con M INITAB para el problema 14.36 aparece la información 
necesaria para establecer el intervalo de confianza de 95%. 


Pr edi ct or Coef 

Const ant 35.82 

X 0.4 7 64 

El término 


St Dev T 

10.18 3.52 

0.1525 3.12 


P 

0. 006 
0.011 


1 

VÑ^2 V ) 

se conoce como el error estándar correspondiente al coeficiente de regresión estimado. En los resultados de M IN ITAB este 
error estándar es 0. 1 5 2 5. Para hallar el intervalo de confianza de 95%, se multiplica este error estándar por t 975 , y después 
este término se suma y se resta a a x = 0.476, con lo que se obtiene el siguiente intervalo de confianza para Ay 


0.476 ± 2.23(0.1525) = 0.476 ± 0.340 


14.38 En el problema 14.1, encontrar los límites de confianza de 95% para las estaturas de los hijos cuyos padres 
tienen una estatura de: a) 65.0 y b) 70.0 ¡n. Encontrar el Intervalo de confianza sin ayuda de software, así como 
con ayuda de M INITAB. 

SOLUCIÓN 


Como t 975 = 2.23 para (12 - 2) 


10 grados de libertad, los límites de confianza de 95% para Y P están dados por 
2.23 


F n ± 


VÑ~^2 ' 


Sy.x\ N ± 1 


(*o - 


S 2 

22 Y 


donde T 0 = 35.82 ± 0.476X 0 , S y . x = 1.28, S x = 2.66 y N = 12. 

a) Si X 0 = 65.0, entonces Y 0 = 66.76 in. Además, ( X 0 - A') 2 = (65.0 - 66.67) 2 = 2.78. De manera que los límites de 
confianza de 95% son 


2 23 / 2 78 

66.76 ± —= (1.28) W 12 + 1 + ^^ = 66.76 ± 3.30 in 

VTÓ v V 2.66 2 

Es decir, se puede tener una confianza de 95% deque las estaturas de los hijos están entre 63.46 y 70.06 in. 
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b) Si X 0 = 70.0, entonces Y 0 = 69.14 in. Además, (X 0 - X) 2 = (70.0 - 66.67) 2 = 11.09. De manera que los límites de 
confianza de 95% son 69.14 ± 3.45 in; es decir, se puede tener una confianza de 95% deque las estaturas de los hijos 
estén entre 65.69 y 72.59 ¡n. 

En el siguiente fragmento de los resultados obtenidos con M IN ITAB para el problema 14.36 aparecen los límites de 
confianza para las estaturas de los hijos. 

Predi c t ed Val ues 

Fi t St Dev F i t 95.0% Cl 95. 0% Pl 

66.789 0.478 (65.724, 67.855) (63.485, 70.094) 

69.171 0.650 (67.723, 70.620) (65.724, 72.618) 

A los Intervalos de confianza para individuos se les conoce como intervalos de predicción. Los intervalos de predicción del 
95% aparecen en negritas. Estos intervalos coinciden con los antes calculados, salvo errores de redondeo. 

14.39 En el problema 14.1, encontrar los límites de confianza de 95% para la estatura media de los hijos cuyos padres 
tienen una estatura de: a) 65.0 y b) 70.0 in. Establecer el intervalo de confianza sin ayuda de software, así como 
con ayuda de M INITAB. 

SOLUCIÓN 

Como t g75 = 2.23 para 10 grados de libertad, los límites de confianza de 95% para Y P están dados por 



donde Y 0 = 35.82 + 0.476X 0 , S yx = 1.28, S* = 2.66. 

a) ParaX 0 = 65.0, los límites de confianza serán 66.76 ± 1.07 o bien 65.7 y 67.8. 

b) ParaX 0 = 70.0, los límites de confianza serán 69.14 ± 1.45 o bien 67.7 y 70.6. 

En el siguiente fragmento de los resultados obtenidos con M INITAB para el problema 14.36 aparecen los límites de con¬ 
fianza para las estaturas medias. 

Predi c t ed Val ues 

F i t St De v F i t 95. 0% Cl 95. 0% Pl 

6 6.7 8 9 0.4 7 8 ( 6 5.7 2 4 , 6 7.8 5 5 ) ( 6 3.4 8 5, 7 0.0 9 4 ) 

69.171 0.650 (67.723, 70.620) (65.724, 72.618) 


PROBLEMAS SUPLEM ENTARIOS 


REGRESIÓN LINEALY CORRELACIÓN 

14.40 En la tabla 14.22 se presentan las calificaciones (denotadas X y Y, respectivamente) de 10 estudiantes en dos primeros 
exámenes de biología. 

a) Construir un diagrama de dispersión. 

b ) Encontrar la recta de regresión de mínimos cuadrados de Y sobreX. 

c) Encontrar la recta de regresión de mínimos cuadrados deX sobre Y. 

d) Graficar las dos de rectas de regresión de los incisos ó) y c) en el diagrama de dispersión del inciso a). 

14.41 Dados los datos de la tabla 14.22, encontrar: a) s y x y b ) s x Y . 
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Tabla 14.22 


Calificación en el primer examen (X) 

6 5 8 8 7 6 10 4 9 7 

Calificación en el segundo examen (Y) 

8 7 7 10 5 8 10 6 8 6 


14.42 Dados los datos del problema 14.40, calcular: a) la variación total de Y, b ) la variación no explicada de Y y c) la variación 
explicada de Y. 

14.43 Empleando los resultados del problema 14.42, encontrar el coeficiente de correlación entre los dos conjuntos de califica¬ 
ciones del problema 14.40. 

14.44 Empleando la fórmula del producto-momento encontrar el coeficiente de correlación entre los dos conjuntos de califica¬ 
ciones del problema 14.40; comparar el resultado con el coeficiente de correlación dado por SPSS, SAS, STATISTIX, 
MINITAB y EXCEL. 

14.45 Dados los datos del problema 14.40a), encontrar la covarianza: a) directamente y b ) usando la fórmula s XY = rs x s Y y los 
resultados de los problemas 14.43 y 14.44. 

14.46 En la tabla 14.23 se presenta la edad X y la presión sistólica Y de 12 mujeres. 

a) Encontrar el coeficiente de correlación entreX y Y empleando la fórmula del producto-momento, EXCEL, M INITAB, 
SAS, SPSS y STATISTIX. 

b) Determinar la ecuación de regresión por mínimos cuadrados de V sobre X resolviendo las ecuaciones normales y 
empleando EXCEL, M IN ITAB, SAS, SPSS y STATISTIX. 

c) Estimar la presión sanguínea de una mujer de 45 años de edad. 


Tabla 14.23 


Edad (X) 

56 

42 

72 

36 

63 

47 

55 

49 

38 

42 

68 

60 

Presión sanguínea (Y) 

147 

125 

160 

118 

149 

128 

150 

145 

115 

140 

152 

155 


14.47 Encontrar los coeficientes de correlación para los datos: a) del problema 13.32 y b ) del problema 13.35. 

14.48 El coeficiente de correlación entre dos variablesX y Y es r = 0.60. Si s x = 1.50, s Y = 2.00, X = 10 y Y = 20, hallar la 
ecuación de la recta de regresión: a) de Y sobreX y b) deX sobre Y. 

14.49 Dados los datos del problema 14.48, calcular: a) s y x y b) s X Y . 

14.50 Si s Y x = 3 y s Y = 5, hallar r. 

14.51 SI el coeficiente de correlación entreX y V es 0.50, ¿qué porcentaje de la variación total queda no explicada por la ecuación 
de regresión? 

14.52 a) Probar que la ecuación de la recta de regresión de Y sobreX puede expresarse como 

Y -Y = S ^-( X-X) 

4 


b ) Escribir la ecuación análoga para la recta de regresión deX sobre Y. 
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14.53 a) Calcular el coeficiente de correlación entre los valores correspondientes deX y Y dados en la tabla 14.24. 


Tabla 14.24 


X 

2 

4 

5 

6 

8 

11 

Y 

18 

12 

10 

8 

7 

5 


b ) M ultiplicar por 2 cada uno de los valores deX que aparecen en la tabla y sumarles 6. M ultiplicar por 3 cada uno de 
los valores de Y que aparecen en la tabla y restarles 15. E ncontrar el coeficiente de correlación entre estos dos nuevos 
conjuntos de valores y explicar por qué sí, o por qué no, se obtienen los mismos resultados que en el inciso a). 

14.54 a) Dados los datos del problema 14.53, incisos a) y b), encontrar las ecuaciones de regresión de Y sobreX. 
b ) A nalizar la relación entre estas dos ecuaciones de regresión. 

14.55 a) Probar que el coeficiente de correlación entreX y y se puede expresar como 

XY-XY 

b ) Aplicar este método al problema 14.1. 

14.56 Probar que el coeficiente de correlación es independiente de la elección del origen de las variables o de las unidades en las 
que estén expresadas. ( Sugerencia: Suponga queX' = qX +4 y Y' = c 2 Y + B donde c 1( c 2 ,A y B son constantes cuales¬ 
quiera, y probar que el coeficiente de correlación entreX'y Y ' es el mismo que entreX y Y.) 


14.57 a) Probar que, para la regresión lineal, 

2 2 
s Y.X _ S X.Y 
2 2 

4 4 

b) ¿Es válido este resultado para la regresión no lineal? 

COEFICIENTE DE CORRELACIÓN PARA DATOS AGRUPADOS 

14.58 Encontrar el coeficiente de correlación entre las estaturas y los pesos de 300 hombres adultos, presentadas en la tabla 14.25, 
una tabla de frecuencias. 


Tabla 14.25 




EstaturasX (¡n) 



59-62 

63-66 

67-70 

71-74 

75-78 


90-109 

2 

1 





110-129 

7 

8 

4 

2 


n 

130-149 

5 

15 

22 

7 

1 

>- 

150-169 

2 

12 

63 

19 

5 

ix 

170-189 


7 

28 

32 

12 


190-209 


2 

10 

20 

7 


210-229 



1 

4 

2 
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14.59 a) Dados los datos del problema 14.58, encontrar la ecuación de regresión por mínimos cuadrados de Y sobreX. 
b ) Estimar los pesos de los hombres cuyas estaturas son 64 y 72 in, respectivamente. 

14.60 Dados los datos del problema 14.58, encontrar: a) s Y x Y b) s XY . 

14.61 Establecer la fórmula (21) de este capítulo para el coeficiente de correlación de datos agrupados. 

CORRELACIÓN DE SERIES DE TIEMPO 

14.62 En la tabla 14.26 se presenta el gasto anual promedio, por consumidor, en atención a la salud y el Ingreso per cápita desde 
1999 hasta 2004. Encontrar el coeficiente de correlación. 


Tabla 14.26 


Año 

1999 

2000 

2001 

2002 

2003 

2004 

Costo de la atención a la salud 

1959 

2 066 

2 182 

2 350 

2 416 

2 574 

Ingreso per cápita 

27 939 

29 845 

30 574 

30 810 

31 484 

33 050 


Fuente: Bureau of Laboral Statistics and U .S. Bureau of Economic Analysis. 


14.63 En la tabla 14.27 se muestran temperatura y precipitación promedio durante el mes de julio en una ciudad, desde 2000 hasta 
2006. El al lar el coeficiente de correlación. 

Tabla 14.27 


Año 

2000 

2001 

2002 

2003 

2004 

2005 

2006 

Temperatura (°F) 

78.1 

71.8 

75.6 

72.7 

75.3 

73.6 

75.1 

Precipitación (¡n) 

6.23 

3.64 

3.42 

2.84 

1.83 

2.82 

4.04 


TEORÍA MUESTRAL DE LA CORRELACIÓN 

14.64 En una muestra de tamaño 27, el coeficiente de correlación calculado es 0.40. ¿Puede concluirse a los niveles de signifi¬ 
cancia: a) 0.05 y b ) 0.01, que el coeficiente de correlación poblacional correspondiente sea distinto de cero? 

14.65 En una muestra de tamaño 35, el coeficiente de correlación calculado es 0.50. ¿Puede concluirse al nivel de significancia 
0.05 que el coeficiente de correlación poblacional sea: a) tan pequeño como p = 0.30 y b) tan grande como p = 0.70? 

14.66 Encontrar los límites de confianza de: a) 95% y b) 99% para un coeficiente de correlación que se ha calculado que es 0.60 
a partir de una muestra de tamaño 28. 

14.67 Resolver el problema 14.66 si la muestra es de tamaño 52. 

14.68 Encontrar los límites de confianza de 95% para el coeficiente de correlación calculado: a) en el problema 14.46 y b) en el 
problema 14.58. 

14.69 Los coeficientes de correlación obtenidos a partir de dos muestras, una de tamaño 23 y otra de tamaño 28, fueron 0.80 y 
0.95, respectivamente. ¿Puede concluirse a los niveles de significancia: a) 0.05 y b ) 0.01, que existe una diferencia signi¬ 
ficativa entre estos dos coeficientes? 
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TEORÍA MUESTRAL DE LA REGRESIÓN 

14.70 Basándose en una muestra de tamaño 27, la ecuación de regresión de y sobreX encontrada es Y = 25.0 + 2.00X. Si s Y x = 
1.50, s Y x = 1.50, s x = 3.00 y X = 7.50, encontrar los límites de confianza de a) 95% y b ) 99% para el coeficiente de 
regresión. 

14.71 Dados los datos del problema 14.70, al nivel de significancia 0.01, probar la hipótesis de que el coeficiente de regresión 
poblacional es: a) tan bajo como 1.70 y b) tan alto como 2.20. 

14.72 Dados los datos del problema 14.70, encontrar los límites de confianza: a) de 95% y b ) de 99% para Y cuando X = 6.00. 

14.73 Dados los datos del problema 14.70, encontrar los límites de confianza: a) de 95% y b) de 99% para la media de todos los 
valores de y correspondientes aX = 6.00. 

14.74 Dados los datos del problema 14.46, encontrar los límites de confianza de 95% para: a) el coeficiente de regresión de Y 
sobreX, b ) las presiones sanguíneas de todas las mujeres cuya edad es de 45 años y c) la media de las presiones sanguíneas 
de todas las mujeres de 45 años. 


Correlación 
múltiple Y 

CORRELACIÓN 

PARCIAL 


CORRELACIÓN MÚLTIPLE 

AI grado de relación que existe entre tres o más variables se le conoce como correlación múltiple. Los principios fun¬ 
damentales relacionados con los problemas de correlación múltiple son análogos a los de los problemas de correlación 
simple, tratados en el capítulo 14. 

NOTACIÓN EMPLEANDO SUBÍNDICES 

Para generalizar a un número mayor de variables conviene adoptar una notación con subíndices. 

SeanX^Xj, X 3 ,... las variables en consideración. Entonces, conX u , X 12 , X 13 ,... se denotan los valores que asume 
la variableX 1; y X 21 , X 22 ,X 23 ,... denotan los valores que asume la variableX 2 , y así sucesivamente. Con esta notación, 
una suma como X 23 -t- X 22 -i- X 23 -t- ■ ■ ■ —i— X 2 ^y puede expresarse como Ejli x 2 j, Ey x y 0 simplemente E X 2 . C uando 
no puede haber lugar a ambigüedad, se usa la última notación. En este caso, la media de X 2 se expresa: X 2 = 

E Xi/N. 

ECUACIONES DE REGRESIÓN Y PLANOS DE REGRESIÓN 

Una ecuación de regresión es una ecuación que se utiliza para estimar una variable dependiente, por ejemplo X 1; a 
partir de las variables independientes X 2 , X 3 ,... y se le llama ecuación de regresión de X 1 sobre X 2 , X 3 ,... Empleando 
la notación funcional esto puede expresarse brevemente como X 1 = F(X 2 , X 3 ,...) (que se lee "X 1 es una función deX 2 , 
X 3 , etcétera"). 

En el caso de tres variables, la ecuación de regresión más simple deX 3 sobreX 2 y X 3 tiene la forma siguiente: 

x \ = Ai.23 + b\ 23 X 2 + b\ 32 X 3 ( 1 ) 

donde b 123 , ó 12 3 y b 132 son constantes. SI en la ecuación (1) X 3 se mantiene constante, la gráfica deX 2 versus X 2 es 
una línea recta cuya pendiente es ó 12 3 . SI X 2 se mantiene constante, la gráfica deX 3 versus X 3 es una línea recta cuya 
pendiente es b 132 . Como se ve, el subíndice después del punto Indica la variable que se mantiene constante en cada 
caso. 

Dado queX-L varía parcialmente debido a la variación deX 2 y parcialmente debido a la variación deX 3 , a b 123 y 
b 13 2 se les llama coeficientes de regresión parcial deX 2 sobreX 2 manteniendo X 3 constante y deX 2 sobreX 3 mante¬ 
niendo X 2 constante, respectivamente. 
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A la ecuación (1) se le llama ecuación de regresión lineal deX-L sobre X 2 y X 3 . En un sistema rectangular tridimen¬ 
sional de coordenadas, esta ecuación representa un plano al que se le conoce como plano de regresión, que es una 
generalización de la recta de regresión para dos variables, considerada en el capítulo 13. 

ECUACIONES NORMALES PARA LOS PLANOS DE 
REGRESIÓN DE MÍNIMOS CUADRADOS 

Así como existen rectas de regresión de mínimos cuadrados que aproximan un conjunto de puntos (X, Y) en un diagra¬ 
ma de dispersión bidimensional, también existen planos de regresión de mínimos cuadrados que se ajustan a un con¬ 
junto de N puntos (X 1; X 2 , X 3 ) en un diagrama de dispersión tridimensional. 

El plano de regresión de mínimos cuadrados deX : sobreX 2 y X 3 tiene la ecuación (1), donde b 123 , b 123 y b 132 se 
determinan resolviendo simultáneamente las ecuaciones normales 

Y = b\zsN + & 12.3 S ^2 + ¿ 13.2 S ^23 

Y XiX 2 = ¿ 1.23 Y + ¿ 12.3 Y ^2 + ¿ 13.2 S ^ 2^3 ( 2 ) 


Y X\X 3 — ¿ 1.23 Y ^3 + ¿ 12.3 Y X 2 X 3 + ¿ 13.2 Y ^3 

Estas ecuaciones pueden obtenerse formalmente multiplicando, en cada caso, ambos lados de la ecuación (1) por 1, 
porX 2 y porX 3 , y sumando después ambos lados. 

A menos que se especifique otra cosa, siempre que se haga referencia a una ecuación de regresión se entenderá que 
se está haciendo referencia a la ecuación de regresión de mínimos cuadrados. 

SI x ] = X x - X¡, x 2 = X 2 - X 2 y x 3 = X 3 - X 3 , la ecuación de regresión deX 2 sobreX 2 y X 3 puede expresarse 
de manera más sencilla como 

X\ = ¿12.3^2 + ¿13.2-X3 (3) 

donde b 12 . 3 y b 13 . 2 se obtienen resolviendo simultáneamente las ecuaciones 

Y x l x 2 = ^212.3 Y x 2 + ¿ 13.2 Y X 2 X 3 

(4) 

Y x l x 3 — ¿ 12.3 Y X 2 X 3 + ¿ 13.2 Y X 3 


Estas ecuaciones, que son equivalentes a las ecuaciones normales (2), se obtienen formalmente multiplicando, de 
manera sucesiva, ambos lados de la ecuación (3) por x 2 y por x 3 , y después sumando ambos lados (ver problema 
15.8). 

PLANOSDE REGRESION Y COEFICIENTES DE CORRELACIÓN 

SI los coeficientes de correlación entre las variables X 3 y X 2 ,X 1 y X 3 , y X 2 y X 3 , que se calcularon en el capítulo 14, se 
denotan respectivamente r 12 , r 13 y r 23 (también llamados coeficientes de correlación de orden cero), entonces la ecua¬ 
ción del plano de regresión de mínimos cuadrados tiene la ecuación 

X ' = ( '~ 12 ~ 0^23 \ *2 | / >'13 ~ ''122-23 ^ *3 ^ 

Si \ l-r| /í 2 V 1 - 2*23 ) *3 

donde x x = X - X u x 2 = X 2 - X 2 y x 3 = X 3 - X 3 , y donde s 1; s 2 y s 3 son, respectivamente, las desviaciones están¬ 
dar deX 1; X 2 y X 3 (ver problema 15.9). 

Obsérvese que si la varlableX 3 no existe ys¡X 1 = yyX 2 = X entonces la ecuación (5) se reduce a la ecuación (25) 
del capítulo 14. 
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ERROR ESTÁNDAR DE ESTIMACIÓN 

M ediante una obvia generalización de la ecuación (8) del capítulo 14 se define el error estándar de estimación deX : 
sobreX 2 yX 3 como 


1.23 — 


/£(* 1 - ^l,est) 2 

N 


( 6 ) 


dondeX lest indica los valores estimados deX x obtenidos con las ecuaciones de regresión (1) o (5). 

El error estándar de estimación también se puede calcularen términos de los coeficientes de correlación r 12 , r 13 y 
r 23 , empleando la fórmula 


*^ 1.23 — S 1 


/ 1 - r \ 2 - r 2 u - ij 3 + 2ri 2 r 13 r 23 
1 — r 23 


(7) 


La interpretación muestral del error estándar de estimación para dos variables, dada en la página 313 para el caso 
en el que N es grande, puede extenderse a tres dimensiones reem plazando las rectas paralelas a la recta de regresión 
por planos paralelos al plano de regresión. La fórmula í L2 3 = \/N/(N- 3)s 123 proporciona una mejor estimación 
del error estándar de estimación poblacional. 


COEFICIENTE DE CORRELACIÓN MÚLTIPLE 

El coeficiente de correlación múltiple se define mediante una extensión de la ecuación (12) o (14) del capítulo 14. En 
el caso de dos variables independientes, por ejemplo, el coeficiente de correlación múltiple está dado por 


7 ? 1.23 — 



( 8 ) 


donde s 3 es la desviación estándar de la variableX 1; y s 123 está dado por la ecuación (6) o por la ecuación (7). La 
cantidad R 2 L23 se conoce como coeficiente de determinación múltiple. 

Cuando se emplea una ecuación de regresión lineal, al coeficiente de correlación múltiple se le llama coeficiente 
de correlación lineal múltiple. A menos que se especifique otra cosa, el término correlación múltiple se empleará para 
correlación lineal múltiple. 

La ecuación (8) también puede expresarse en términos der 12 , r 13 y r 23 como 


Ri2j = + (9 ) 
V 1 r 23 

El valor de un coeficiente de correlación múltiple, como R 123 , está entre 0 y 1, Inclusive. Cuanto más cerca está de 
1, mejor es la relación lineal éntrelas variables. Cuanto más cerca esté de 0, peor será la relación lineal entre las varia¬ 
bles. SI un coeficiente de correlación múltiple es 1, a esa correlación se le llama correlación perfecta. Aunque un 
coeficiente de correlación sea 0, esto Indica que no hay relación lineal entre las variables, pero puede que exista una 
relación no lineal. 

CAMBIO DE LA VARIABLE DEPENDIENTE 

Los resultados anteriores son válidos cuando X 3 se considera la variable dependiente. Pero si en lugar deX : quiere 
considerarse a X 3 (por ejemplo) como la variable dependiente, lo único que hay que hacer es sustituir, en las fórmulas 
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ya obtenidas, el subíndice 1 por el subíndice 3 y el subíndice 3 por el subíndice! Por ejemplo, la ecuación de regresión 
deX 3 sobre X 1 y X 2 es 


x 3 = í r 23 - Ci3Ci 2 \ *2 | / r ¡3 - r 23 r 12 \ x¡ 

$3 \ 1 r \2 ) $2 V I 

de acuerdo con la ecuación (5) y empleando las Igualdades r 32 = r 23 , r 31 = r 13 y r 21 = r 12 . 

GENERALIZACIONES A MÁS DE TRES VARIABLES 

Estas generalizaciones se obtienen por analogía con los resultados anteriores. Por ejemplo, la ecuación de regresión 
11neal de X 3 sobre X 2 , X 3 y X 4 se expresa 

^ 1.234 + ^12.34X2 + ¿13.24X3 + ¿14.23X4 (11) 

y representa un hiperplano en el espacio de cuatro dimensiones. M ulti pl i cando sucesivamente ambos lados de la 
ecuación (11) por 1, X 2 , X 3 y X 4 y después sumando ambos lados se obtienen las ecuaciones normales con las que se 
determina b 1 234 , b 1234 b 13 24 y b 1423 ; sustituyendo sus valores en la ecuación (11) se obtiene la ecuación de regresión 
de mínimos cuadrados deX 3 sobre X 2 , X 3 y X 4 . Esta ecuación de regresión de mínimos cuadrados se puede expresar 
en forma similar a la de la ecuación (5). (Ver problema 15.41.) 

CORRELACIÓN PARCIAL 

También es Importante medir la correlación entre una variable dependiente y determinada variable Independiente 
cuando todas las demás variables permanecen constantes; es decir, cuando se eliminan los efectos de todas las demás 
variables. Esto se logra definiendo un coeficiente de correlación parcial, como la ecuación (12) del capítulo 14, salvo 
que deberán considerarse las variaciones explicadas y no explicadas que surgen con esa determinada variable Indepen¬ 
diente y sin ella. 

Si r 12 3 denota el coeficiente de correlación parcial entre X 3 y X 2 cuando X 3 permanece constante, se encuentra 
que 


\/TÍ r i3)0 ^ 3 ) 

De manera similar, si r 12i34 denota el coeficiente de correlación parcial entreX x y X 2 cuando X 3 y X 4 permanecen cons¬ 
tantes, entonces 


r 12.4 — r 13.4 r 23.4 r 12.3 — r 14.3 r 24.3 n 

''12.34 = 1 = 7- (13) 

Vi 1 -^3. 4 )(1 -^3.4) y ( 1 ^*^4.3)C 1 ^24.3) 

Estos resultados son útiles, pues mediante ellos puede hacerse que cualquier coeficiente de correlación parcial depen¬ 
da finalmente de los coeficientes de correlación r 12 , r 23 , etc. (es decir, de los coeficientes de correlación de orden 
cero). 

Se vio que en el caso de dos variables, X y Y, si las ecuaciones de las dos rectas de regresión son Y = a 0 + a 3 X y 
X = b 0 + b-jY, se tiene que r 2 = a 1 b 1 (ver problema 14.22). Este resultado puede generalizarse. Por ejemplo, si 



Xi 

— ¿1.234 + ¿12.34X2 + ¿13.24X3 + ¿14.23X4 

(14) 

y 

X" 4 

= ¿4.123 + ¿41.23XT + ¿ 42 .I 3 X 2 + ¿43.12X3 

(15) 
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son, respectivamente, las ecuaciones de regresión lineal deX x sobreX 2 , X 3 y X 4 y deX 4 sobreX 1; X 2 y X 3 , entonces 



(16) 


(ver problema 15.18). Esta fórmula puede tomarse como punto de partida para una definición de los coeficientes de 
correlación lineal parcial. 

RELACIONES ENTRE COEFICIENTES DE CORRELACIÓN MÚLTIPLE 
Y COEFICIENTES DE CORRELACIÓN PARCIAL 

Se pueden encontrar resultados Interesantes que relacionan los coeficientes de correlación múltiple. Por ejemplo, se 
encuentra que 


1 — ^ 1.23 — (1 — r n)(l — ''i3 2 ) 

1 — -^ 1.234 = (1 — r 12 )(l — r| 32 )(l — '"14.93) 


(17) 


(18) 


Las generalizaciones de estos resultados son fáciles de efectuar. 

REGRESIÓN MÚLTIPLE NO LINEAL 

Los resultados anteriores para la regresión lineal múltiple se pueden extender a la regresión no lineal múltiple. Los 
coeficientes de correlación parcial y de correlación múltiple pueden definirse mediante métodos similares a los pro¬ 
porcionados antes. 


PROBLEMAS RESUELTOS 


ECUACIONES DE REGRESIÓN CON TRES VARIABLES 

15.1 Usando la notación adecuada mediante subíndices, dar la ecuación de regresión de: a) X 2 sobreX 1 y X 3 ; b) X 3 
sobre X 1( X 2 y X 4 , y c) X 5 sobreX 1; X 2 , X 3 y X 4 . 

SOLUCIÓN 

а) X 2 = 62.13 + 621.3X4 + 623.1X3 

б) X" 3 = ¿3.124 + ¿31.24-Xl + ¿32.14X9 + ¿34.12-X4 

C) X ¡ = ¿5.1234 + ¿51.234 + ¿52.I34X2 + ¿53.124^33 + ¿54.I23X4 

15.2 Dar las ecuaciones normales correspondientes a las ecuaciones a) X 3 = b 312 + b 312 X 1 + b 321 X 2 y b) X 3 = 

^ 1.234 + ^12.34^2 + ^13.24^3 + ^14.23^4- 

SOLUCIÓN 

a) La ecuación se multiplica, sucesivamente, por l.Xj y X 2 y se suma a ambos lados. Las ecuaciones normales son 


E X 3 = ¿3.12A1 + ¿31.2-Xl +¿32.lX]X2 

E XiX 3 = ¿ 312 XI x'i + ¿ 31.2 E Xf + ¿ 3 2.i E xqx 2 

E X 2 X 3 = ¿312 E X 2 + ¿31.2 E X\X 2 + ¿ 32.1 E XX 
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b) La ecuación se multiplica, sucesivamente, por 1,X 2 , X 3 y X 4 y se suma a ambos lados. Las ecuaciones normales son 

Yh %l = ¿,.234-^ + ¿12.34 X XX + ¿13.24 Y ^3 + ¿>14.23 Y X4 

Y *1*2 = ¿1.234 Y ^ 12.34 Y ^2 + ¿*13.24 X XAX^ + ¿14.23 1] ^2^4 

XI ^T^3 = 1.234 X ^3 + ¿12.34 X XXX^ + ¿13.24 X ^3 + ¿14.23 X ^3^4 

X X\X 4 = ¿1.234 X *4 + ¿12.34 X -^2X4 + ¿13.24 X X3X4 + ¿14.23 X ^4 

O bsérvese que éstas no son deducciones délas ecuaci ones normal es, sino únicamente una manera formal para recor¬ 

darlas. 

El número de ecuaciones normales es igual al número de constantes desconocidas. 

15.3 En la tabla 15.1 se presentan los pesosX! dados a la libra (Ib) más cercana, las estaturasX 2 a la pulgada (¡n) 
más cercana y las edades X 3 al año más cercano de 12 niños. 

a) Encontrar la ecuación de regresión de mínimos cuadrados deX 3 sobreX 2 y X 3 . 

b) Determinar los valores estimados deX 3 a partir de los valores dados deX 2 y X 3 . 

c) Estimar el peso de un niño de 9 años que mide 54 in. 

d) Encontrar la ecuación de regresión de mínimos cuadrados empleando EXCEL, M INITAB, SPSS y 
STATISTIX. 


Tabla 15.1 


Peso (X 3 ) 

64 

71 

53 

67 

55 

58 

77 

57 

56 

51 

76 

68 

Estatura (X 2 ) 

57 

59 

49 

62 

51 

50 

55 

48 

52 

42 

61 

57 

Edad (X 3 ) 

8 

10 

6 

11 

8 

7 

10 

9 

10 

6 

12 

9 


SOLUCIÓN 

a) La ecuación de regresión de mínimos cuadrados deX 3 sobreX 2 y X 3 puede expresarse como 

*1 = ¿1.23 + ¿12.3X2 + ¿I3.2XL3 

Las ecuaciones normales de la ecuación de regresión de mínimos cuadrados son 

X X4 =b\ 2 T,N + ¿12.3 X XX 4- ¿13.2 Y¿ XL3 

X X¡X 2 = ¿1.23 X XS + ¿12.3 X Xf 2 + ¿13.2 X XT2AT3 (19) 

X X1X3 = ¿1 23 X xl 3 + ¿12.3 X xr 2 xr 3 + ¿13.2 X xff 

Para calcular las sumas se elabora la tabla 15.2. (Aunque la columna con el encabezado x\ no se necesita en este 

momento, se ha incluido para referencias futuras.) Empleando la tabla 15.2, las ecuaciones normales (19) se convier¬ 
ten en 


12b, 23 — 643b l2 . 3 + 106¿)[32 — 753 

643b, 23 + 34 843b,2.3 + 5 779bi 3 . 2 = 40 830 
106b, 23 + 5 779b, 2.3 + 976b, 3 2 = 6 796 


( 20 ) 
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Resolviendo, b l23 = 3.65 1 2, b 123 = 0.8546 y b 132 = 1.5063, con lo que la ecuación de regresión es 

X 1 = 3.6512 + 0.8546X 2 + 1.5063X 3 o X 3 = 3.65 + 0.855X 2 + 1.506X 3 (21) 


Tabla 15.2 


*1 

*2 

*3 

x? 


x^ 

X 3 X 2 

X 3 X 3 

X 2 X 3 

64 

57 

8 

4 096 

3 249 

64 

3 648 

512 

456 

71 

59 

10 

5 041 

3 481 

100 

4 189 

710 

590 

53 

49 

6 

2 809 

2 401 

36 

2 597 

318 

294 

67 

62 

11 

4 489 

3 844 

121 

4 154 

737 

682 

55 

51 

8 

3 025 

2 601 

64 

2 805 

440 

408 

58 

50 

7 

3 364 

2 500 

49 

2 900 

406 

350 

77 

55 

10 

5 929 

3 025 

100 

4 235 

770 

550 

57 

48 

9 

3 249 

2 304 

81 

2 736 

513 

432 

56 

52 

10 

3 136 

2 704 

100 

2 912 

560 

520 

51 

42 

6 

2 601 

1 764 

36 

2 142 

306 

252 

76 

61 

12 

5 776 

3 721 

144 

4 636 

912 

732 

68 

57 

9 

4 624 

3 249 

81 

3 876 

612 

513 

E*i 

£*2 

£*3 

£X? 

£*2 

£*3 

£X 3 X 2 

£ x iX 3 

£X 2 x 3 

= 753 

= 643 

= 106 

= 48 139 

= 34 843 

= 976 

= 40 830 

= 6 796 

= 5 779 


En el problema 15.6 se presenta otro método en el que se evita tener que resolver ecuaciones simultáneas. 

b ) Sustituyendo, en la ecuación de regresión (21), X 2 y X 3 por sus valores se obtienen los valores estimados paraX 3 , que 

se denotan X l est . Por ejemplo, sustituyendo en la ecuación (21) X 2 = 57 y X 3 = 8, se obtieneX l est = 64.414. 

De manera similar se obtienen los demás valores estimados paraXj. Estos valores se dan en la tabla 15.3 junto 
con los valores muéstrales deX 3 . 


Tabla 15.3 


Xi.est 

64.414 

69.136 

54.564 

73.206 

59.286 

56.925 

65.717 

58.229 

63.153 

48.582 

73.857 

65.920 

Xi 

64 

71 

53 

67 

55 

58 

77 

57 

56 

51 

76 

68 


c) Haciendo X 2 = 54 yX 3 = 9 en la ecuación (21), se obtiene el peso estimado X lest = 63.356, o 63 Ib, aproximadamente. 

d) En la figura 15-1 se muestra parte de los resultados obtenidos con EXCEL. Para obtener estos resultados se emplea la 
secuencia Tools-> Data analysis-> Regresslon. En los resultados, los coeficientes b 123 = 3.65 1 2, b u3 = 0.8546 y 
b 132 = 1.5063 aparecen en negritas. 

Parte de los resultados deMINITAB esl a ecuacl ón de regresl ón XI = 3. 7 + 0. 855X2 + 1. 51X3. 
U na vez ingresados los datos en C1 - C 3 se emplea la secuencia Stat -> Regression — > Regression. 

En la figura 15-2 se presenta una parte de los resultados de SPSS. Los resultados se obtienen empleando la 
secuencia analyze-* Regression -> Linear. En los resultados, los coeficientes b 123 = 3.651, b 123 = 0.855 y b l32 = 
1.506 aparecen en la columna titulada Un s tandardi zed Coeffl el ents. 

En la figura 15-3 se presenta parte de los resultados de STATISTIX. Los resultados se obtienen empleando la 
secuencia Stastitics — > Linear models-> Linear Regression. 
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XI 

X2 

X3 

64 

57 

8 

71 

59 

10 

53 

49 

6 

67 

62 

11 

55 

51 

8 

58 

50 

7 

77 

55 

10 

57 

48 

9 

56 

52 

10 

51 

42 

6 

76 

61 

12 

68 

57 

9 


RESUMEN 


Estadísticos de la regresión 

R'T! múltiple 

0.841757 

R^2 cuadrado 

0.708554 

R 72 ajustado 

0.643789 

E rror estándar 

5.363215 

Observaciones 

12 

ANÁLISIS DE VARIANZA 

df 

Regresión 

2 

Residuos 

9 

Total 

11 


_ Coeficientes 

Intersección 3.651216 

X2 0.85461 

X3 1.506332 


Figura 15-1 EXCEL, resultados para el problema 15.3d). 


Coeficientes 3 


Modelo 

Coeficientes 

desestandarizados 

Coeficientes 

estandarizados 

t 

Sig. 

B 

Error estándar 

Beta 

1 (Constante) 

3.651 

16.168 


.226 

.826 

X2 

.855 

.452 

.565 

1.892 

.091 

X3 

1.506 

1.414 

.318 

1.065 

.315 


a Variable dependiente: XI 


Figura 15-2 SPSS, resultados para el problema 15.3d). 

Statistix 8.0 

Regresión lineal de mínimos cuadrados de XI de bajo peso 


Variables 


predichas 

Coeficiente 

Error estándar 

T 

P 

VIF 

Constante 

3.65122 

16.1678 

0.23 

0.8264 


X2 

0.85461 

0.45166 

1.89 

0.0910 

2.8 

X3 

1.50633 

1.41427 

1.07 

0.3146 

2.8 


Figura 15-3 STATISTIX, resultados para el problema 15.3d). 

Las soluciones del software son las mismas que las de las ecuaciones normales. 

15.4 Dados los datos del problema 15.3, calcular las desviaciones estándar: a) s 1( b) s 2 y c) s 3 . 

SOLUCIÓN 

a) La cantidad s x es la desviación estándar de la variableXj. Entonces, empleando la tabla 15.2 del problema 15.3 y los 
métodos del capítulo 4, se encuentra 


b ) 

c) 


■Si = 


•S2 = 


■ S 3 = 


EZl 

N 


E x i 

N 


48 139 /753 


12 


3 V = : 


12 y 


:.6035 U 8.61b 


E A ÍE x : 


N 


N 


34 843 /643\ 2 _ 


12 


12 J 


= 5.6930 o bien 5.7 in 


E x i ÍE x 


N 


N 


=1-8181 o bien 1.8 años 
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15.5 Dados los datos del problema 15.3, calcular: a) r 12 , b ) r 13 , c) r 23 . Calcular las tres correlaciones empleando 
EXCEL, MINITAB ySTATISTIX. 

SOLUCIÓN 

a) La cantidad r 12 es el coeficiente de correlación lineal entre las variablesy X 2 , ignorando a la variableX 3 . Por lo 
tanto, empleando los métodos del capítulo 14, se tiene 


N £M~(E ^l)(E^) 

y/[Ni: - (E *) 2 ][*£ - (E *2) 2 ] 

(12)(40,8?0) - (753)(643) 
y/[(12)(48,1?9) - (753) 2 ][(12)(34,8¿3) - (643) 2 ] 


o bien 


0.82 


b ) y c) Empleando las fórmulas correspondientes se obtiene r 12 = 0.7698, o bien 0.77, y r 23 = 0.7984, o bien 0.80. 
d) Usando EXCEL se tiene: 


A 

B 

C 

D 

E 

XI 

X2 

X3 

0.819645 

=CORREL(A2:A13,B2:B13) 

64 

57 

8 

0.769817 

=CORREL(A2:A13,C2:C13) 

71 

59 

10 

0.798407 

=CORREL(B2:B13,C2:C13) 

53 

49 

6 



67 

62 

11 



55 

51 

8 



58 

50 

7 



77 

55 

10 



57 

48 

9 



56 

52 

10 



51 

42 

6 



76 

61 

12 



68 

57 

9 




Como se ve, r u está en DI, r 13 está en D2 y r 23 está enD3.EnEl,E2 y E 3 aparecen las funciones de EXCEL 
empleadas para obtener los resultados. 

Usando M INITAB, la secuencia Stat -> Basic Statistics —> Correlation da el resultado siguiente. 


Cor r el 

aciones: 

XI, X 2, 


XI 

X2 

X2 

0.820 



0.001 


X3 

0.770 

0.798 


0.003 

0. 002 

Ce 1 1 C 

ont e nt s: 

Pea r s on 


P-VaI ue 

La correlación r 12 está en la intersección de XI y X 2 y es 0.820. El valor debajo de él, 0.001, es el valor p para 
probar que no hay correlación poblacional entre XI y X 2. Como este valor p es menor de 0.05, se rechaza la hipótesis 
nula de que no hay correlación poblacional entre la estatura (X2) y el peso (XI). Las demás correlaciones con sus 
valores p se leen de manera similar. 
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Empleando en SPSS la secuencia Analyze-» Correlate—> Bivariateda el siguiente resultado que se lee de 
manera similar al de M INITAB. 


Correlaciones 



XI 

X2 

X3 

XI 

Correlación de Pearson 

1 

.820** 

.770** 


Sig. (2 colas) 


.001 

.003 


N 

12 

12 

12 

X2 

Correlación de Pearson 

.820** 

1 

.798** 


Sig. (2 colas) 

.001 


.002 


N 

12 

12 

12 

X3 

Correlación de Pearson 

.770** 

.798** 

1 


Sig. (2 colas) 

.003 

.002 



N 

12 

12 

12 


**La correlación es significativa al nivel 0.01 (2 colas). 


Empleando STATISTIX, la secuencia Stastitics —> Linear models-+ Correlation da el resultado siguiente, 
que es similar al de los otros software. 

Statistix 8.0 


Cor r el at i ons 

(Pearson) 



XI 

X2 

X2 

0.8196 


P-VALUE 

0.0011 


X3 

0.7698 

0.7984 


0.0034 

0.0018 


U na vez más se ve la cantidad de tiempo que se ahorra con un software que realiza los cálculos para el 
usuario. 

15.6 Repetir el problema 15.3a) empleando la ecuación (5) de este capítulo y los resultados de los problemas 15.4 
y 15.5. 

SOLUCIÓN 

M ultiplicando ambos lados de la ecuación (5) por Sj, la ecuación de regresión deX 3 sobreX 2 y X 3 es, 


donde a-! = x¡ - x¡, 
(22) se convierte en 


I - r 2 

1 '23 


r l2 ~ r 13 r 23 \ / £l_ , 


¡¡ 2 . 


>'13 - 'T 2 r 23 \ /íi' 
f — >23 / v3 


a 3 


( 22 ) 


x 2 = X 2 - X 2 y a 3 = X 3 - X 2 . Empleando los resultados de los problemas 15.4 y 15.5, la ecuación 


x, =0.8546 x 2 + 1.5063x 3 

V X 75o _ x 

Dado que X¡ = ¿r— 1 = —= 62.750 X 2 =^^= 53.583 y Z 3 = 8.833 

(de acuerdo con la tabla 15.2 del problema 15.3), la ecuación buscada puede expresarse como 

X, - 62.750 = 0.8546(Xf 2 - 53.583) + 1.506(JT 3 - 8.833) 


que coincide con el resultado del problema 15.3a). 
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15.7 Dados los datos del problema 15.3, determinar: a) el promedio de Incremento en el peso por pulgada de Incre¬ 
mento en la altura de niños de una misma edad, y b) el promedio de Incremento en el peso por año en niños de 
una misma estatura. 

SOLUCIÓN 

De acuerdo con la ecuación de regresión obtenida en el problema 15.3a) o 15.6, se encuentra que la respuesta para a) es 
0.8546, o bien 0.9 Ib, y la respuesta para b ) es 1.5063, o bien 1.5 Ib, aproximadamente. 

15.8 M ostrar que las ecuaciones (3) y (4) de este capítulo se obtienen de las ecuaciones (1) y (2). 

SOLUCIÓN 

De acuerdo con la primera de las ecuaciones (2), dividiendo ambos lados entre N se tiene 

X\ = 23 + ¿ 12 . 3^2 + b X32 X 3 (23) 

Restando la ecuación (23) de la ecuación (1) se obtiene 

= b U3 (X 2 — X 2 ) + b\ 32 {X 3 — ^ 3 ) 

o bien x ¡ = b x22 x 2 -{- b\ 32 x 3 (24) 

que es la ecuación (3). 

Sean X¡ = x¡ 4 - X¡, X 2 = x 2 + X 2 y X 3 = x 3 + X 3 en la segunda y tercera ecuación de las ecuaciones (2). Entonces, 
después de algunas simplificaciones algebraicas y empleando los resultados^ x ; = E *2 = E x 3 = 0 , estas ecuaciones 
se convierten en 

E x l x 2 = Ó 12.3 E x 2 + Ó 13.2 E X 2 X 3 + XX 2 [b¡ 23 + b\ 2 3 X 2 + ¿ 13 . 2^3 — X ¡] (25) 

E x i x 3 = Ó12.3 E X 2 X 3 + ^13.2 E x 3 + XX 3 [b X 23 4- b X23 X 2 + b i32 X 3 — X x ] (26) 

las cuales se reducen a las ecuaciones (4) debido a que las cantidades que se encuentran entre corchetes en el lado derecho 
de las ecuaciones (25) y (26) son cero de acuerdo con la ecuación (1). 


15.9 Deducir la ecuación (5) que se repite a continuación: 


•«I 


í r \2~ / ' 1 3 r 23 N \ x 2 , í r 13 ~~ /- 12 r 23 \ ^3 

V 1-^3 j *2 \ 1-4 Js 3 


SOLUCIÓN 


De acuerdo con las ecuaciones (25) y (26) 


¿*12.3 E x 2 + b\ 3 2 Y X 2 X 3 ~ Y x l x 2 
b\2.3 Y X 2 X 3 + b\ 3 2 Y x 3 = Y x l x 3 


Como 


2 N 


y 



E xj = Nsj y Y x 3 = Ns 3- Dado P ue 


r 23 ~ 


Y X 2 X 3 

V / (E^)(E-i) 


E X 2 X 3 
Ns 2 s 3 


(5) 


( 27 ) 


E X 2 X 3 = Xs 2 s 3 r 23 . De Igual manera, Y x i x 2 = Ns x s 2 r 12 y Y x i x 3 = Ns x s 3 r x3 . 
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Sustituyendo en la ecuación (27) y simplificando, se encuentra 

b\23 s 2 + ¿I3.2Í3T23 = ‘S’l^'12 

b\2.3 s 2 r 23 + Ó13.2Í3 =s l r l3 

Resolviendo las ecuaciones simultáneas (28), se tiene 


(28) 


^12.3 — 


( >'n ~ 'nOcA ( Ji\ 

1 1-4 /W 


y ^13.2 — 


Sustituyendo estos valores en la ecuación x x = b 12 . 3 X 2 + ^i 3 . 2 x 3 [ecuación 
buscado. 


f r 13 ~ r l2 r 2 3 \ (sA 

V 1-4 / W 

(24)] y dividiendo entre s x se llega al resultado 


ERROR ESTÁNDAR DE ESTIMACIÓN 

15.10 Dados los datos del problema 15.3, calcular el error estándar de estimación deX x sobreX 2 y X 3 . 

SOLUCIÓN 

De acuerdo con la tabla 15.3 del problema 15.3, se tiene 


•51.23 — 


E(*l - Aest) 2 

N 


(64 - 64.414) 2 + (71 - 69.136) 2 + • • ■ + (68 - 65.920) 2 


12 


= 4.6447 o bien 4.61b 


El error estándar de estimación poblacional se estima mediante í L23 = ^/N/(N - 3)íi. 23 = 5.3 Ib en este caso. 


15.11 Para obtener el resultado del problema 15.10, utilizar 


• ? 12.3 — 


1 - 4 - 4 - 4 + 2r n r n r Zi 


1 -r 


2 

23 


SOLUCIÓN 

De acuerdo con los problemas 15.4a) y 15.5 se tiene 


5i.23 = 8.6035 


1 - (0.8196) 2 - (0.7698) 2 - (0.7984) 2 + 2(0.8196)(0.7698)(0.7984) 


- (0.7984)- 


= 4 . 61 b 


Obsérvese que con el método empleado en este problema se obtiene el error estándar de estimación sin necesidad de 
usar la ecuación de regresión. 


COEFICIENTE DE CORRELACIÓN MÚLTIPLE 

15.12 Dados los datos del problema 15.3, calcular el coeficiente de correlación lineal múltiple deX 3 sobreX 2 y X 3 . 
Consultar los resultados de M INITAB dados en la solución del problema 15.3 para determinar el coeficiente 
de correlación lineal múltiple. 
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SOLUCIÓN 
Primer método 

De acuerdo con los resultados de los problemas 15.4a) y 15.10 se tiene 


^ 1.23 — 



L (4-6447) 2 

V (8.6035) 2 


0.8418 


Segundo método 

De acuerdo con los resultados del problema 15.5 se tiene 


R I 23 — 


4 + r 13 ~ ^ r \2 r 13 r 2: 

1 — *23 


(0.8196) 2 + (0.7698) 2 - 2(0.8196)(0.7698)(0.7984) 


1 - (0.7984) 2 


= 0.8418 


Obsérvese que el coeficiente de correlación múltipl e, R ! . 23 ' es mayor que cualquiera de los coeficientes r 12 o r 13 (ver 
problema 15.5). Esto siempre es así y en realidad es de esperar, ya que al tomar en cuenta más variables independientes 
relevantes, se llega a una relación mejor entre las variables. 

El fragmento siguiente de los resultados de M INITAB en la solución del problema 15.3, R- Sq = 70. 9%, da el 
cuadrado del coeficiente de correlación lineal múltiple. El coeficiente de correlación lineal múltiple es la raíz cuadrada de 
esta cantidad. Es decir, ^ 123 = \/0.709 = 0.842. 


15.13 Dados los datos del problema 15.3, calcular el coeficiente de determinación múltiple de X x sobre X 2 y X 3 . 
Consultar los resultados de M INITAB dados en la solución del problema 15.3 para determinar el coeficiente 
de determinación múltiple. 

SOLUCIÓN 

El coeficiente de determinación múltiple deX 3 sobreX 2 y X 3 es 

R ¡. 23 = (0.8418) 2 = 0.7086 

empleando el problema 15.12. Por lo tanto, cerca de 71% déla variación total enX x se explica usando la ecuación de regre¬ 
sión. 

El coeficiente de determinación múltiple se lee directamente en los resultados de M INITAB dados en la solución del 
problema 15.3,y esR-Sq = 7 0.9%. 


15.14 Según los datos del problema 15.3, calcular: a) fi 213 y b) fi 312 y comparar estos valores con el valor deR 123 . 

SOLUCIÓN 


a) 


Rl 13 — 


1 _ ,.2 
i M3 


>12 + 4 - 2r 12 r l3 r 23 _ /(0.8196) 2 + (0.7984) 2 - 2(0.8196)(0.7698)(0.7984) 


1 - (0.7698) 3 


= 0.8606 


b) 


R 3 17 — 


1-4 


4 + 4 - 2r 12 r 13 r 23 _ /(0.7698) 2 + (0.7984) 2 - 2(0.8196)(0.7698)(0.7984) 


1 - (0.8196) 2 


= 0.8234 


Este problema ¡lustra el hecho de que, en general, R 213 , R 312 y R 123 no son necesariamente iguales, como se puede 
ver en la comparación con el problema 15.12. 
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15.15 Si R ! 23 = 1, probar que: a) R 213 = 1 y b) R 312 = 1. 

SOLUCIÓN 


R\ -> 3 — 


Ro n — 


r I2 + r l3 ~ 2/'l2 r 13 r 23 

1 - r 1 
1 r 23 

r 12 + r 23 ~ — r 12 / ~13 r 23 

1-^3 


(29) 


(30) 


a) Haciendo en la ecuación (29), R 123 = 1 y elevando al cuadrado ambos lados, ij 2 + ij 3 -2r l2 r 13 r 23 = 1 - r 23 . 
Entonces 


i '¡2 r 23 ~ 2r ¡2 r ¡3 r 23 — 1 — i'¡ 3 o bien 


r l2 + r 23 — 2r 12 ri 3 T 2 3 
I - r 2 

i 1 13 


= 1 


Es decir, 7 ?| 13 = 1 y R 213 = 1, ya que el coeficiente de correlación múltiple se considera no negativo. 
b) R 3 U = 1 sigue del inciso a) intercambiando los subíndices 2 y 3 en la fórmula para R 2 í i 3 = 1. 

15.16 Si fi 123 = 0, ¿implica necesariamente que fi 213 = 0? 

SOLUCIÓN 


De acuerdo con la ecuación (29), R 213 = 0 si y sólo si 

''I 2 + cf 3 — 2;' I2 r 13 r 23 = 0 obien 2r 12 r 13 r 23 = r 2 u + ff 3 
Entonces, de acuerdo con la ecuación (30) se tienen 


2^2.1 3 — 


1 3“ r 23 


r h) 


I - r 2 
1 1 13 



lo cual no es necesariamente igual a cero. 


CORRELACIÓN PARCIAL 

15.17 Dados los datos del problema 15.3, calcular los coeficientes de correlación lineal parcial r 123 , r 132 y r 231 . 
También determinar estos coeficientes empleando STATISTIX. 

SOLUCIÓN 

r i 3 ~ ; 'i 2 c 23 _ r 23 — r 12 r 13 

\/(l — r h)(l ~ r 23) \/(l — r n)(^ ~ r i 3 ) 

Empleando los resultados del problema 15.5, se encuentra quer 12 3 = 0.5334, r 132 = 0.3346 y r 231 = 0.4580. Se concluye 
que entre los niños de una misma edad, el coeficiente de correlación entre peso y estatura es 0.53; entre los niños de una 
misma estatura el coeficiente de correlación entre peso y edad es 0.33. Como estos resultados se basan en una muestra 
pequeña, de sólo 12 niños, no son tan confiables como si se obtuviesen de una muestra mayor. 

Con la secuencia Statistics —> Linear models —> Partial Correlations se obtiene el cuadro de diálogo de la figura 
15-4. Este cuadro se llena como se indica en la figura. Se busca r 123 . El resultado es el siguiente. 

St ati st i x 8. 

Partial Correlations wi t h XI 
Co nt r o I I ed f or X3 


r l2 ~ r \3 r 23 



X2 


0.5335 
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Figura 15-4 STATISTIX, cuadro de diálogo para el problema 15.17. 


STATISTIX puede emplearse de manera similar para hallar las otras dos correlaciones parciales buscadas. 


15.18 SI X 1 = b 123 + b 12 . 3 X 2 + b 13 . 2 X 3 y X 3 = ¿> 312 + b 321 X 2 + b 3L2 X 1 son las ecuaciones de regresión deX 3 sobre 
X 2 y X 3 , y deX 3 sobreX 2 y X h respectivamente, probar que r\ 31 = 613 . 2631 . 2 - 

SOLUCIÓN 


La ecuación de regresión deX 3 sobreX 2 y X 3 puede expresarse como [ver ecuación (5) de este capítulo] 


X, =X, = 


l - r h 


ru ~ r 13 r 2 3 \ ! s _± ) (x 2 _ X 2 ) + 


r 13 — r 12 r 23 \ 7 - S 1 


1-^3 


yj (*3 -X 3 ) 


La ecuación de regresión deX 3 sobreX 2 y X l puede expresarse como [ver ecuación (10)] 


X-¡ — Xv = 


1 r\ 2 


r n -r l 3 ru\(Sj,j {X 2 _x 2) + 


r i3 — r 2 3 r 12 \ ( s 3 


1 - r 2 
1 r i 2 




De acuerdo con las ecuaciones (31) y (32), los coeficientes deX 3 y X 1 son, respectivamente, 

^ r 13 — r 23 r \2 


6119 — 


1 


r I3 — r 12 r 23) / -Jl , y 


■«3 


611.9 — 


1 r\ 2 


(31) 

(32) 


Por lo tanto 


613 . 2631.2 — 


(r~i3 — ^ 12 ^ 23 )" _ .2 

(1 - n 3 )(l - r^) ,|3 ' 2 


15.19 SI r U3 = 0, probar que 


s) 



Ó) f' 23.1 



SOLUCIÓN 

Si 


C 12 — >'i3 r 23 


^3)0 r 23) 


= 0 
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se tiene que r 12 = r 13 r 23 . 



>'¡3 ~ r I2 r 23 



^'13 — ( r I3 r 23) r 23 _ r 13 (l — r 23) 



b ) Se intercambian los subíndices 1 y 2 en el resultado del inciso a). 

CORRELACIÓN MÚLTIPLE Y CORRELACIÓN PARCIAL PARA CUATRO O MÁS VARIABLES 

15.20 Un examen de ingreso a la universidad consta de tres partes: matemáticas, español y conocimientos generales. 
Para determinar si los resultados de este examen sirven para predecir el desempeño en el curso de estadística, 
se recolectan y se analizan los datos de una muestra de 200 estudiantes. Sea 

X 3 = calificación en el curso de estadística X 3 = calificación en el examen de español 

X 2 = calificación en el examen de matemáticas X 4 = calificación en el examen de conocimientos generales 

Se obtienen los valores siguientes: 

Xi =75 Si = 10 X 2 = 24 5 2 = 5 

X 3 = 15 5 3 = 3 X 4 = 36 5 4 = 6 

r 12 = 0.90 r 13 = 0.75 r l4 = 0.80 r 23 = 0.70 r 24 = 0.70 r 34 = 0.85 

Encontrar la ecuación de regresión de mínimos cuadrados deX 1 sobreX 2 , X 3 y X 4 . 

SOLUCIÓN 

Generalizando el resultado del problema 15.8, la ecuación de regresión de mínimos cuadrados deX 3 sobreX 2 ,X 3 y X 4 puede 
expresarse como 


x \ — ¿12.34-52 + ñl3.24-T3 + ¿ 14 . 23 T 4 

donde t> 12 34 , b 13 24 y t> 1423 se obtienen a partir de las ecuaciones normales 


(33) 


x l x 2 = X’12.34 x 2 + X>13.24 x 2 x 3 + ¿14.23 X 2 X 4 

J2 X l x 3 = X’12.34 J2 X 2 X 3 + ¿13.24 Y1 x \ + ^14.23 J2 X 3 X 4 

x \ x 4 = ¿ , 12.34 S X 2 X 4 + ^13.24 X 3 X 4 + 5)4.23 x 4 


(34) 


y donde x\ — X\ — X 2 — ^2 — ^2 ? -^3 — ^3 — ^2 V -^4 — X 4 — X 4 . 

A partir de los datos dados, se encuentra 

x\ - Nsl = 5 000 J2 X \ X 2 = bls^r^ = 9 000 J2 X 2 X 3 = Ns l s¡r 2i = 2 100 

£x| -Ns¡ = \ 800 5Dx,x 3 = NSiS¡r l3 = 4 500 J3 X 2 X 4 = Ns 2 s 4 r 24 = 4 200 

xj - Ns 2 4 = 7 200 J2 x i x 4 = NS\S4r l4 = 9 600 J2 X 3 X 4 = Ns 3 V 34 = 3 060 

Sustituyendo estos valores en las ecuaciones (34) y resolviendo el sistema de ecuaciones, se obtiene 


b 12.34 = 1.3 3 3 3 ¿13.24 = 0.0000 ¿ 14.23 = 0.5556 

que al sustituirlos en la ecuación (33) dan la ecuación de regresión buscada 


(35) 


o bien 


x, = 1.3333 x 2 + 0.0000*3 + 0.5556.v- 4 
Xi - 75 = 1.3333(7^2 - 24) + 0.5556(X 4 - 27) 


(36) 


o bien 


X¡ = 22.9999 + 1.3333X2 + 0.5556X, 
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La solución exacta de la ecuación (34) da b U34 = ó 1324 = Oy ó l42 3 = §, de manera que la ecuación de regresión 

también se puede expresar como 

A] = 23 4- 3 Xf 2 -P (37) 

Es Interesante observar que en la ecuación de regresión no aparecen las calificaciones de español, X 3 . Esto no signi¬ 
fica que los conocimientos de español no sean importantes para el desempeño en estadística, sino que significa que la 
necesidad del español, en lo que se refiere a la predicción de la calificación en estadística, queda ampliamente reflejada por 
las calificaciones obtenidas en los otros exámenes. 


15.21 Dos estudiantes que aprobaron el examen de admisión del problema 15.20 obtuvieron, respectivamente, las 
calificaciones siguientes: a) 30 en matemáticas, 18 en español y 32 en conocimientos generales y b) 18 en 
matemáticas, 20 en español y 36 en conocimientos generales. ¿Cuál será su calificación en estadística? 

SOLUCIÓN 

a) Sustituyendo X 2 = 30,X 3 = 18 y X 4 = 32 en la ecuación (37), la calificación en estadística seráX 3 = 81. 

b) Procediendo como en el inciso a) conX 2 = 18, X 3 = 20 y X 4 = 36, se encuentra X l = 67. 


15.22 Dados los datos del problema 15.20, encontrar los coeficientes de correlación parcial: a) r 12 34 , b) r 1324 y 

C ) r 14.23- 

SOLUCIÓN 


a) y ó) 


r*12 — r \4 r 24 



''l3 ~ Ti 4 /- 34 

a /(! — ^? 4 )( 1 — d 4 ) 


r 23.4 — 


r 23 — T24T34 

\/(l - 4 )(! - 'i) 


Sustituyendo con los valores del problema 15.20, se obtiene r 124 = 0.7935, r 134 = 0. 2215 y r 23 4 = 0 . 2 7 91. Por lo 
tanto, 


r 12.4 — r \3A r 23.4 

\/(l - ''13.4)0 — ^23.4) 


0.7814 


y 


^ 13.4 — Ti 2 . 4 r 2 3.4 


1 


'"Í2.4)0 ^*23.4) 


0.0000 



Sustituyendo con los valores del problema 15.20, se obtiene r 14 3 = 0.4664, r 12 3 = 0.7939 y r 24 3 = 0.2 7 91. Por lo 
tanto 


''14.23 


r 14.3 — 'T2.3 r 24.3 



0.4193 


15.23 Interpretar los coeficientes de correlación parcial: a) r 124 , b) r 134 , c) r 12 34 , d) r 143 y e) r 14 23 obtenidos en el 
problema 15.22. 

SOLUCIÓN 

a) r 124 = 0.7935 representa el coeficiente de correlación (lineal) entre las calificaciones en estadística y las calificaciones 
en matemáticas de estudiantes con una misma calificación en conocimientos generales. Para obtener este coeficiente 
no se toman en cuenta las calificaciones en español (así como otros factores tampoco considerados), como resulta 
evidente por el hecho de que se ha omitido el subíndice 3. 
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b ) r 134 = 0.2215 representa el coeficiente de correlación entre las calificaciones en estadística y las calificaciones en 
español de estudiantes que tienen la misma calificación en conocimientos generales. Aquí no se han considerado las 
calificaciones en matemáticas. 

c) r 12.34 = 0.7814 representa el coeficiente de correlación entre las calificaciones en estadística y las calificaciones en 
matemáticas de estudiantes con la misma calificación, tanto en español como en conocimientos generales. 

d) r 143 = 0.4664 representa el coeficiente de correlación entre las calificaciones en estadística y las calificaciones en 
conocimientos generales de estudiantes con la misma calificación en español. 

e ) r 14.23 = 0.4 1 93 representa el coeficiente de correlación entre las calificaciones en estadística y las calificaciones en 
conocimientos generales de estudiantes con la misma calificación tanto en matemáticas como en español. 


15.24 a) Dados los datos del problema 15.20, mostrar que 


r 12.4 — ri3.4r 2 3.4 


r 12.3 — r*i4 3^24 3 


(38) 



b) Explicar el significado de la igualdad del Inciso a). 

SOLUCIÓN 

a) El lado Izquierdo de la ecuación (38) fue evaluado en el problema 15.22a) dando como resultado 0.7814. Para evaluar 
el lado derecho de la ecuación (38), se usan los resultados del problema 15.22c); el resultado también es 0.7814. Por 
lo tanto, en este caso en especial, la igualdad es válida. M ediante manipulaciones algebraicas puede demostrarse que 
esta igualdad también es válida en general. 

b ) EI lado Izquierdo de la ecuación (38) es r 12 34 y el lado derecho es r 12 43 . C orno r 12 34 es la correlación entre las variables 
X 2 y X 2 cuando X 3 y X 4 permanecen constantes, y r 12 43 es la correlación entre ias variables X 3 y X 2 cuando X 4 y X 3 
permanecen constantes, resulta Inmediatamente evidente que la igualdad debe ser válida. 


15.25 Dados los datos del problema 15.20, encontrar: a) el coeficiente de correlación múltiple fi L234 y b) el error 
estándar de estimación s li234 . 


SOLUCIÓN 


a) 


(1 — /- ? 2)(1 — r ? 3 . 2 )(l — ^ 14 . 23 ) o bien R 1234 — 0.93 1 0 


dado que r 12 = 0.90 de acuerdo con el problema 15.20, r 14 23 = 0.4 1 93, de acuerdo con el problema 15.22c), y 


r 13 — r l2 r 23 


0.75 — (0.90)(0.70) 


" 3855 



Otro método 


Intercambiando en la primera ecuación los subíndices 2 y 4 se obtiene 


(1 — / ‘I 4 )(1 — r ? 3 . 4 )(l — ^T 2 . 3 4 ) o bien R 1234 — 0.93 1 0 


donde se han empleado directamente los resultados del problema 15.22a). 


b ) 



o bien 



Comparar con la ecuación (8) de este capítulo. 
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PROBLEMAS SUPLEMENTARIOS 

ECUACIONES DE REGRESIÓN CON TRES VARIABLES 

15.26 Empleando la notación adecuada con subíndices, escribir las ecuaciones de regresión de: a) X 3 sobreXj y X 2 , y b) X 4 sobre 
X 1 ,X 2 ,X 3 yX 5 . 

15.27 Escribir las ecuaciones normales correspondientes a la ecuación de regresión de: a) X 2 sobreXj y X 3 , y b) X 5 sobreX 1 , X 2 , 
X 3 yX 4 . 

15.28 En la tabla 15.4 se presentan los valores de tres variables: X 3 ,X 2 y X 3 . 

a) Encontrar la ecuación de regresión de mínimos cuadrados deX 3 sobreXj y X 2 . 

b) EstimarX 3 paraXj = 10 y X 2 = 6. 


Tabla 15.4 


*1 

3 

5 

6 

8 

12 

14 

*2 

16 

10 

7 

4 

3 

2 

*3 

90 

72 

54 

42 

30 

12 


15.29 U n maestro de matemáticas quiere determinar la relación que hay entre las calificaciones del examen final y las califica¬ 
ciones de dos exámenes parciales durante el semestre. Siendo Xj,X 2 y X 3 , respectivamente, las calificaciones del primero 
y segundo exámenes parciales y del examen final, el profesor calcula los siguientes valores correspondientes a un total de 
120 alumnos. 

X t = 6.8 X 2 = 7.0 X 3 = 74 

Si = 1.0 s 2 = 0.80 s 2 = 9.0 

r u = 0.60 r 13 = 0.70 r 23 = 0.65 

a) Encontrar la ecuación de regresión de mínimos cuadrados deX 3 sobreXj y X 2 . 

b ) Estimar la calificación final de dos estudiantes cuyas calificaciones en los dos exámenes parciales fueron: 1) 9 y 7, y 
2) 4 y 8 . 

15.30 Los datos de la tabla 15.5 dan el precio en miles (X 3 ), la cantidad de recámaras (X 2 ) y la cantidad de baños (X 3 ) de 10 casas. 
U sar las ecuaciones normales para hallar la ecuación de regresión de mínimos cuadrados deXj sobreX 2 y X 3 . U sar EX C E L, 
M INITAB, SAS, SPSS y STATISTIX para encontrar la ecuación de regresión de mínimos cuadrados deXj sobreX 2 y X 3 . 
U sar la ecuación de regresión de mínimos cuadrados deXj sobreX 2 y X 3 para estimar el precio de una casa que tenga cinco 
recámaras y cuatro baños. 


Tabla 15.5 


Precio 

Recámaras 

Baños 

165 

3 

2 

200 

3 

3 

225 

4 

3 

O 

co 

I—1 

2 

3 

202 

4 

2 

250 

4 

4 

275 

3 

4 

300 

5 

3 

155 

2 

2 

230 

4 

4 
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ERROR ESTÁNDAR DE ESTIMACIÓN 

15.31 Dados los datos del problema 15.28, encontrar el error estándar de estimación deX 3 sobre X 3 y X 2 . 

15.32 Dados los datos del problema 15.29, encontrar el error estándar de estimación de: a) X 3 sobre X l y X 2 y b) X 1 sobreX 2 

y x 3 . 

COEFICIENTE DE CORRELACIÓN MÚLTIPLE 

15.33 Dados los datos del problema 15.28, calcular el coeficiente de correlación lineal múltiple deX 3 sobreX 3 y X 2 . 

15.34 Dados los datos del problema 15.29, calcular: a) fi 312 , b) R 123 y c) R 213 . 

15.35 a) SI r 12 = r 13 = r 23 = r + 1, mostrar que 


rV2 


*1.23 ~ *2.31 — *3.12 ^ 


Vi + r 


b ) Analizar el caso r = 1. 

15.36 Si R 123 = O, probar que |7- 23 | > |/r 2 |y|r 23 | > |r 13 | e interpretar. 

CORRELACIÓN PARCIAL 

15.37 Dados los datos del problema 15.28, calcular los coeficientes de correlación lineal parcial r 123 , r 132 y r 231 . Calcularlos 
también usando STATISTIX. 

15.38 Resolver el problema 15.37 con los datos del problema 15.29. 

15.39 Si r 12 = r 13 = r 23 = r # 1, mostrar que r 12 3 = r 132 = r 231 = r/(l + r). A nalizar el caso r = 1. 

15.40 Si r 12 3 = 1, mostrar que: a) |r 13 2 | = 1, b) |r 231 | = 1, c) R 123 = 1 y d) s 123 = 0. 

CORRELACIÓN MÚLTIPLE Y CORRELACIÓN PARCIAL CON CUATRO O MÁS VARIABLES 

15.41 M ostrar que la ecuación de regresión deX 4 sobreX^ X 2 y X 3 puede escribirse como 



donde a 3 , a 2 y a 3 se determinan resolviendo simultáneamente las ecuaciones 


a \ r n + Oi r n + o 3 r 13 — r i4 


a \ r 2l + a 2 r 22 + fl 3 r 23 — r 24 


a i r 3 i + rr 2 r 32 + O3T33 — r 34 


y donde x¡ = Xj - X¡, r j} = 1 y j = 1, 2, 3 y 4. Generalizar al caso con más de cuatro variables. 
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15.42 Dados X¡ = 20, X 2 = 36, X 2 = 12, X 4 = 80, s 3 = 1.0, s 2 = 2.0, s 3 = 1.5, s 4 = 6.0, r 12 = -0.20, r 13 = 0.40, r 23 = 0.50, 
r 14 = 0.40, r 24 = 0.30 y r 34 = -0.10, a) encontrar la ecuación de regresión deX 4 sobreX^ X 2 y X 3 , y b) estimarX 4 para 
X 3 = 15, X 2 = 40 y X 3 = 14. 


15.43 

15.44 

15.45 


Dados los datos del problema 15.42, encontrar: a) r 4123 , Jb) r 4213 y c) r 4312 . 


Dados los datos del problema 15.42, encontrar: a) R 4123 y b) s 4123 . 


Los gastos médicos anuales de quince hombres adultos se correlacionan con otros factores de salud. En un estudio se con¬ 
sideran gastos médicos anuales, Y, así como la información sobre las siguientes variables independientes, 




{? 


O, si es no fumador 
si es fumador 


X 2 = cantidad de dinero gastado semanalmente en alcohol, 


X 3 =; horas semanales de ejercicio, 

! 0, poco informado sobre la alimentación 
1, informado medianamente sobre la alimentación 
2, altamente informado sobre la alimentación 


X 5 = peso X b = edad 

La notación empleada en este problema se encuentra en muchos libros de estadística. V se emplea como variable depen¬ 
diente y X, con subíndices, como variables independientes. Empleando los datos de la tabla 15.6, encontrar, resolviendo las 
ecuaciones normales, la ecuación de regresión de Y sobre X 3 a X 6 y comparar esta solución con las soluciones dadas por 
EXCEL, MINITAB, SAS, SPSS y STATISTIX. 


Tabla 15.6 


Gastos médicos 

Fumador 

Alcohol 

Ejercicio 

Alimentación 

Peso 

Edad 

2 100 

0 

20 

5 

1 

185 

50 

2 378 

1 

25 

0 

1 

200 

42 

1657 

0 

10 

10 

2 

175 

37 

2 584 

1 

20 

5 

2 

225 

54 

2 658 

1 

25 

0 

1 

220 

32 

1 842 

0 

0 

10 

1 

165 

34 

2 786 

1 

25 

5 

0 

225 

30 

2 178 

0 

10 

10 

1 

O 

oo 

I — 1 

41 

3 198 

1 

30 

0 

1 

225 

31 

1 782 

0 

5 

10 

0 

O 

OO 

I — 1 

45 

2 399 

0 

25 

12 

2 

225 

45 

2 423 

0 

15 

15 

0 

220 

33 

3 700 

1 

25 

0 

1 

275 

43 

2 892 

1 

30 

5 

1 

230 

42 

2 350 

1 

30 

10 

1 

245 

40 
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OBJETIVO DEL ANÁLISIS DE VARIANZA 

En el capítulo 8 se usó la teoría del muestreo para probar la importancia de la diferencia entredós medias muéstrales 
y se supuso que las dos poblaciones de las que provenían las muestras tenían la misma varianza. Hay ocasiones que se 
necesita probar la Importancia de la diferencia entre tres o más medias muéstrales o, lo que es equivalente, probar la 
hipótesis nula de que todas estas medias muéstrales son ¡guales. 

EJEMPLO 1 Supóngase que en un experimento agrícola se emplean cuatro diferentes tratamientos químicos para el suelo, y se 
obtienen, respectivamente, con los siguientes rendimientos medios de trigo: 28, 22,18 y 24 bushels por acre. ¿Existe diferencia 
significativa entre estas medias o la dispersión observada se debe sólo a la casualidad? 

Problemas como éstese resuelven empleando una técnica desarrollada por Fischer y que se denomina análisis de vari anza. En 
esta técnica se usa la distribución F, ya vista en el capítulo 11. 

CLASIFICACIÓN EN UN SENTIDO O EXPERIM ENTOS CON UN FACTOR 

En un experimento de un factor, las mediciones (u observaciones) se hacen de a grupos Independientes de muestras, 
y b es la cantidad de mediciones en cada muestra. Se habla de a tratamientos, cada uno con b repeticiones o b réplicas. 
En el ejemplo 1, a = 4. 

Los resultados de un experimento de un factor se acostumbra presentarlos en una tabla con a renglones y ó colum¬ 
nas, como la tabla 16.1. Aquí, X ¡ k denota la medición del renglón j y columna k, donde/ = 1, 2,..., a y donde k= 1, 
2 b. Porejempl °,X 35 significa la quinta medición del tercer tratamiento. 


X L 
X 2 . 

K 

La media de las mediciones en el renglón / se denota X¡. Se tiene 

1 h 

x i. x jk j=l,2,...,a 

k=i 


Tabla 16.1 


Tratamiento 1 

X n , X 12 , ■ ■ ■, x 15 

Tratamiento 2 

X 2 i, X 22 , ■■■,X 2b 



Tratamiento a 

*aL*a2. 


( 1 ) 
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El punto que aparece en X } , sirve para indicar que se suma sobre el índice /c. A los valores X¡ se les llama medias de 
grupo, medias de tratamiento o medias de renglón. La gran media o media general es la media de todas las mediciones 
de todos los grupos y se denota X: 


i a b 


j =i k =i 


( 2 ) 


VARIACIÓN TOTAL, VARIACIÓN DENTRO DE TRATAMIENTOS 
Y VARIACIÓN ENTRE TRATAMIENTOS 


La variación total, que se denota V, se define como la suma de los cuadrados de las desviaciones de cada medición 
respecto a la gran media X 


Expresando esta Identidad como 


Variación total = V = y^X x ¡k ~ X ) 2 

j,k 


X jk -X= (X jk - Xj) + (Xj, - X) 

y después elevando al cuadrado y sumando sobre ¡ y k, se tiene (ver problema 16.1) 


o 


- ^) 2 = E(** - x jf + E(^- - x ) 2 

j,k j,k j,k 


J2(Xjk - X ) 2 = J2(Xjk - Xj) 2 + b J2(Xj. - X ) 2 

j,k j,k j 


(3) 

(4) 

(5) 

( 6 ) 


La primera suma que aparece en el lado derecho de las ecuaciones (5) y (6) es la variación dentro de tos tratamientos 
(ya que se trata de los cuadrados délas desviaciones de las Xy^ respecto a las medias délos tratamientos X¡) y se deno¬ 
ta l/ ff . Por lo tanto, 

v w = Yj^Xjk - Xj. f (7) 

j,k 

La segunda suma que aparece en el lado derecho de las ecuaciones (5) y (6) es la variación éntrelos tratamientos (ya 
que se trata de los cuadrados de las desviaciones de las medias de los tratamientos Xj. respecto a la gran media X) y 
se denota V B . Por lo tanto, 

V n = E {){ j- - ^) 2 = ¿ E (Xj ~ X) 2 (8) 

j,k j 

Por lo tanto, las ecuaciones (5) y (6) se pueden expresar como 

V = v w + V B (9) 


METODOS ABREVIADOS PARA OBTENER LAS VARIACIONES 

Para simplificar el cálculo de las variaciones anteriores se emplean las fórmulas siguientes: 




j,k 


ab 


1 2 T 


2 

ab 


( 10 ) 

( 11 ) 

( 12 ) 


Vw — V - V B 
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donde T es la suma de todos los valores X¡ k y donde T¡ es la suma de todos los valores del tratamiento y-ésimo: 

t = Y.x* T j=Y, x * 

j,k k 

En la práctica, conviene sustraer, de cada dato de la tabla, un valor fijo con objeto de simplificar los cálculos; esto no 
afecta el resultado final. 

MODELO MATEMÁTICO PARA EL ANÁLISIS DE VARIANZA 

Cada renglón de la tabla 16.1 se considera como una muestra aleatoria de tamaño b tomada de la población de ese 
determinado tratamiento. Las X¡ k difieren de la media poblaclonal n¡ correspondiente al tratamiento y en un error alea¬ 
torio que se denota e jk ; por lo tanto, 

Xjk = f¿j + £jk (24) 

Se supone que estos errores están distribuidos de manera normal con media O y varianza o 2 . SI ¡x es la media de 
la población de todos los tratamientos y si se denota a¡ = fx¡ - y¿, entonces /zy = /z + a¡, y la ecuación (14) se convier¬ 
te en 


Xjk — A 4 + a j + e jk (25) 

donde a j = 0 ( ver problema 16.18). De acuerdo con la ecuación (15) y con la suposición de que las e¡ k están dis¬ 
tribuidas de manera normal con media O y varianza o 2 , se concluye que \asX¡ k se pueden considerar como variables 
aleatorias distribuidas en forma normal, con media ¡jl y varianza o 2 . 

La hipótesis nula de que todas las medias de los tratamientos son ¡guales está dada por (H 0 : a¡ = 0;j = 1, 2,..., a) 
o, lo que es equivalente, por (H 0 : n¡ = ¡xj = 1, 2,..., a). SI H 0 es verdadera, todas las poblaciones de los tratamientos 
tendrán la misma distribución normal (es decir, con la misma media y varianza). En estos casos, sólo hay un tratamien¬ 
to poblacional (es decir, todos los tratamientos son estadísticamente Idénticos); en otras palabras, no hay diferencia 
significativa entre los tratamientos. 


VALORES ESPERADOS DE LAS VARIACIONES 

Como se puede demostrar (ver problema 16.19), los valores esperados de 1/^, V B y V están dados por 

E(V w ) = a(b- l)a 2 (16) 

E(V B ) = (a-iy + b^aj (17) 


E(V) = (ab-l)a 2 + bJ2 ®j 


(18) 


De acuerdo con la ecuación (16) se tiene 


V\ 


w 


a(b — 1) 


= a 


(19) 


de manera que 


Sl = 


w 


( 20 ) 


’W ~ n ^\ 
a(b — 1) 

siempre es la mejor estimación (¡nsesgada) de o- 2 , sin Importar si H 0 es o no verdadera. Por otro lado, de acuerdo con 
las ecuaciones (17) y (18) se ve que sólo si H 0 es verdadera (es decir, a¡ = 0) se tendrá 


V R 


a — 1 


y 


ab — 1 


= a 


( 21 ) 
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de manera que sólo en ese caso 


Si = 


Vn 


a — 1 


S 2 = 


V 


ab — 1 


( 22 ) 


proporcionan una estimación insesgada de cr 2 . Pero si H 0 no esverdadera, entonces de acuerdo con la ecuación (17) se 
tiene 


E(S 2 b ) =, 


a — 


-X 


(23) 


DISTRIBUCIONES DE LAS VARIACIONES 

Empleando la propiedad aditiva de j i cuadrada se pueden probar los siguientes teoremas fundamental es que se refieren 
a las distribuciones de las variaciones V B y V\ 

Teorema 1: V w /a 2 tienen una distribución ji cuadrada con a(b - 1) grados de libertad. 

Teorema 2: Bajo la hipótesis nula H 0 , V b /<j 2 y \l¡a 2 tienen distribuciones ji cuadrada con a - 1 
y ab - 1 grados de libertad, respectivamente. 

Es importante subrayar que el teorema 1 es válido, ya sea queH 0 sea o no verdadera, mientras que el teorema 2 sólo 
es válido bajo la suposición dequeH 0 es verdadera. 


PRUEBA F PARA LA HIPÓTESIS NULA DE MEDIAS IGUALES 

Si la hipótesis nula H 0 no es verdadera (es decir, si las medias de los tratamientos no son iguales), como se ve de 
acuerdo con la ecuación (23), se esperará que S 2 B sea mayor que a 2 , y que este efecto se haga más pronunciado a medi¬ 
da que la discrepancia entre las medias aumente. Por otro lado, de acuerdo con las ecuaciones (19) y (20) puede espe¬ 
rarse que S 2 W sea igual a a 2 sin importar si las medias son o no iguales. Setiene, entonces, que un buen estadístico para 
probar la hipótesis H 0 es el proporcionado pors|/S^. Si este estadístico es significativamente grande, se puede con¬ 
cluir que entre las medias de los tratamientos hay una diferencia significativa y, por lo tanto, se puede rechazar H 0 ; si 
no es así, puede aceptarse H 0 o posponer la decisión hasta hacer más análisis. 

Para usar el estadístico S 2 B /S 2 W es preciso conocer su distribución muestral. Este conocimiento lo proporciona el 
teorema 3. 


Teorema 3: El estadístico F = S 2 b/S 2 w tiene distribución F con a - 1 y a(b - 1) grados de li¬ 
bertad. 

El teorema 3 permite probar la hipótesis nula a determinado nivel de significancia, empleando la distribución F (estu¬ 
diada en el capítulo 11) mediante una prueba de una cola. 


TABLAS PARA EL ANÁLISIS DE VARIANZA 

En la tabla 16.2, llamada tab/a para el análisis de varianza, se resumen los cálculos necesarios para la prueba anterior. 
En la práctica se calculan VyV B empleando ya sea el método largo [ecuaciones (3) y (8)] o el método corto [ecuacio¬ 
nes (10) y (11)] y calculando después 1/^ = V -V B . Debe notarse que el número de grados de libertad para la variación 
total (es decir, ab - 1) es igual a la suma de los grados de libertad para la variación entre los tratamientos más los 
grados de libertad para la variación dentro de los tratamientos. 
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Tabla 16.2 


Variación 

Grados de libertad 

Cuadrado medio 

F 

Entre tratamientos, 

v B = bJ2(*j.-x) 2 

j 

a - 1 

A2 V B 

SB ~a- 1 

si 

S 2 W 

con a - 1 y a{b - 1) 
grados de libertad 

Dentro de tratamientos, 

V W = V-V B 

a(b - 1) 

A2 Vw 

¿W — (U i \ 

a(b — 1) 

Total 

V = V B + V w 

= Y J (x jk -xf 

j,k 

ab — 1 



MODIFICACIONES PARA NÚM EROS DISTINTOS DE OBSERVACIONES 


En caso de que los tratamientos 1.a tengan números distintos de observaciones — iguales a N lt .N a , respectiva¬ 

mente— los resultados anteriores pueden modificarse fácil mente. Así se obtiene 


T- 


v=Y J {x jk -xf = Y J x] k -- 


j,k 


j,k 


(24) 


V B = Z(X,-Xf = Z N A*, 

j,k j 

Vw=V-V B 


*) 2 = £ 

j 


n j 


T 2 


(25) 

(26) 


donde V. A . denota la sumatoria, primero sobre k desde 1 hasta N¡ y después la sumatoria sobre j desde 1 hasta a. En 
este caso, la tabla para el análisis de varianza es la tabla 16.3. 


Tabla 16.3 


Variación 

Grados de libertad 

Cuadrado medio 

F 

Entre tratamientos, 

v b = J2 n á*j- ~ ^) 2 

j 

a - 1 

A2 V B 

SB ~a- 1 

si 

Sjv 

con a - 1 y N - a 
grados de libertad 

Dentro de tratamientos, 

V W = V- V B 

N -a 

A2 V w 

— » i 

N — a 

Total, 

V = V B + v w 

= £ ( x Jk - x) 2 

j,k 

N - 1 



CLASIFICACIÓN EN DOSSENTIDOSO EXPERI M ENTOS CON DOSFACTORES 

Las ¡deas del análisis de varianza para clasificaciones en un sentido o experimentos con un factor pueden generalizar¬ 
se. En el ejemplo 2 se ¡lustra el procedimiento para clasificaciones en dos sentidos o experimentos con dos factores. 
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EJEMPLO 2 Supóngase que un experimento agrícola consiste en examinar los rendimientos por acre de cuatro variedades de 
trigo, cultivando cada variedad en cinco tipos de parcelas. Por lo tanto, se necesitarán (4)(5) = 20 parcelas. En tales casos conviene 
reunir las parcelas en bloques, por ejemplo, bloques de cuatro parcelas, y cultivar una variedad diferente de trigo en cada parcela 
del bloque. Así, en este ejemplo se necesitarán 5 bloques. 

En este caso se tienen dos clasificaciones, o dos factores, ya que las diferencias en el rendimiento por acre pueden deberse a: 
1) el tipo de trigo cultivado, o 2) al bloque de que se trate (que pueden presentar diferencias en la fertilidad del suelo, etcétera). 

Por analogía, con el experimento agrícola del ejemplo 2 se acostumbra referirse a los dos factores de un experi¬ 
mento como tratamientos y bloques, aunque por supuesto puede referirse a ellos simplemente como factor 1 y 
factor 2. 

NOTACIÓN PARA EXPE RIM ENTOS CON DOSFACTORES 

Cuando se tienen a tratamientos y b bloques, se construye una tabla como la 16.4, donde se supone que para cada 
tratamiento y para cada bloque hay un valor experimental (por ejemplo, el rendimiento por acre). X jk denota el tra¬ 
tamiento ¡ y el bloqueé. La media de las entradas en el renglón j se denota X¡, donde/ = 1.a, y la media de las 

entradas en la columna k se denota X k , donde k = 1. b. La media general, o gran media, se denota X. En sím¬ 

bolos, 



Tabla 16.4 



Bloque 

1 

2 

b 

Tratamiento 1 

*n 

*12 

*1 b 

Tratamiento 2 

*21 

*22 

*2 b 

Tratamiento a 

*3! 

*32 

■■■ * d b 


X¡ 

T.2 

Xj, 


VARIACIONES EN LOS EXPERI M ENTOS CON DOSFACTORES 

Como en el caso de los experimentos con un factor, se definen las variaciones en los experimentos con dos factores. 
Primero, como en la ecuación (3), se define la variación total, que es 

V = - X? (28) 

í,k 


Expresando la identidad 


Xjk -X= C Xjk - Xj. - Xk + X) + (Xj, -X) + (X k - X) (29) 

elevando al cuadrado y sumando después sobre j y k se puede mostrar que 

V = V k + Vn + Vq 


(30) 
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donde V E = variación debida al error o a la casualidad = ^(X Jk - X¡_ - X k + X) 2 

j,k 

a 

V R = variación entre renglones (tratamientos) = b'^(X j - X) 2 

j =i 

b 

V c = variación entre columnas (bloques) = a')T i {X k - X) 2 

k= i 

La variación debida al erroro a la casualidad se conoce también como variación residual o variación aleatoria. 
Las fórmulas siguientes, análogas a las ecuaciones (10), (11) y (12), son las fórmulas de cálculo abreviadas. 


rpZ 

jk 

( 31 ) 

1 a T 2 

v *=\T.n- T Vb 

v=l 

( 32 ) 

1 b T 2 

Vc = -Y. T l-- k 

a f—' ab 

( 33 ) 

k= 1 


i 

i 

ii 

( 34 ) 


donde Tj es el total (la suma) de las entradas en el renglóny-ésimo, 7^ es el total (la suma) de las entradas en la colum¬ 
na k, y T es el total (la suma) de todas las entradas. 

ANÁLISIS DE VARIANZA PARA EXPERIMENTOS CON DOSFACTORES 

La generalización del modelo matemático para experimentos con un factor, dado por la ecuación (15), lleva a suponer 
que para experimentos con dos factores 

Xjk = H + otj + Pk + e jk (- 55 ) 

donde J2 a¡ = 0 y f3 k = 0. Aquí ¡i es la gran media de la población, a¡ es la parte deX¡ k atribuida a los diferentes 
tratamientos (también llamada efectos del tratamiento), ,4 es la parte deX jk atribuida a los diferentes bloques (también 
llamada efectos de los bloques) y e jk es la parte de atribuida a la casualidad o al error. Como antes, se supone que 
las £j k están distribuidas en forma normal con media 0 y varianza a 2 , de manera que Iastambién están distribuidas 
en forma normal con media fi y varianza a 2 . 

Correspondiendo con los resultados (16), (17) y (18) puede probarse que las esperanzas de las variaciones están 
dadas por 


E(V E ) = (a-\)(b-\)a 2 

( 36 ) 

E(V R ) = (a-l)a 2 + bY / a] 

i 

( 37 ) 

E{V c ) = {b-\)a 2 +aY,f3k 

k 

( 38 ) 

E(V) = (ab - V + b Y, + o Y, & 

( 39 ) 


j k 


Las hipótesis nulas que se quieren probar son dos: 

H^\ todas las medias de los tratamientos (renglones) son ¡guales; es decir, a¡ = 0 y y = 1,..., a. 
todas las medias de los bloques (columnas) son ¡guales; es decir, f3 k = 0 y k = 1,..., b. 
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De acuerdo con la ecuación (36) se ve que, ya sea que//¿ n y H^\ sean o no verdaderas, una estimación insesgada de 
er 2 es la dada por 


S 2 e = 


V, 


(a - 1 )(b- 1 ) 


esto es, E(S 2 e ) = a 2 


Además, si las hipótesis y H ( 0 2) son verdaderas, entonces 


Sl = 


a — 1 


sl = 


V r 


b - 1 


S 2 = 


V 


ab — 1 


(40) 


(41) 


serán estimaciones insesgadas de a 2 . Sin embargo, si y H (2] no son verdaderas, de acuerdo con las ecuaciones 
(37) y (38) se tiene, respectivamente 


E(Sl)=a 2 +^J2 a J 

j 

E(S- C ) = a~ + b _ ^ Pk 


(42) 

(43) 


Los teoremas siguientes son similares a los teoremas ly 2: 

Teorema 4: V E /a 2 es una distribución ji cuadrada con (a - l)(b - 1) grados de libertad, indepen¬ 
dientemente de Hq' 1 o bien H [ Q 2) . 

Teorema 5: Si la hipótesis H { 0 1) es verdadera, V R /a 2 tiene una distribución ji cuadrada con a - 1 
grados de libertad. Si la hipótesis H (2) es verdadera, V c /a 2 tiene una distribución ji cuadrada con 
b - 1 grados de libertad. Si las dos hipótesis H ( 0 ' ] y H¡f ] son verdaderas, V/a 2 es una distribución 
ji cuadrada con ab - 1 grados de libertad. 

Para probar la hipótesis H ( 0 '\ es natural considerar el estadístico S R /S E , ya que, como se ve, de acuerdo con la 
ecuación (42), S 2 R se espera que difiera significativamente de o 2 si las medias délos renglones (tratamientos) son sig¬ 
nificativamente diferentes. De manera similar, para probar la hipótesis H ( Q 2) , se emplea el estadístico S 2 C /S 2 E . En el 
teorema 6 sedan las distribuciones de S R /S E y deS 2 c /S 2 E , este teorema es análogo al teorema 3. 

Teorema 6: Si la hipótesis es verdadera, el estadístico S 2 R /S 2 E tiene una distribución F con 
a - 1 y (a - 1 )(b - 1) grados de libertad. Si la hipótesis H ( Q 2) es verdadera, el estadístico S 2 C /S 2 E 
tiene la distribución F con b - 1 y (a - 1 )(b - 1) grados de libertad. 

El teorema 6 permite aceptar o rechazar Hq 1) y H ( 0 2) a un nivel de significancia determinado. Para mayor claridad y 
facilidad, como en el caso de un factor, para el análisis de varianza se suele construir una tabla como la 16.5. 


EXPERIMENTOS CON DOS FACTORES CON REPLICACIÓN 

En la tabla 16.4, para cada tratamiento y para cada bloque hay únicamente una entrada. M ás información acerca de los 
factores puede obtenerse repitiendo el experimento, proceso que se llama replicación. En esos casos habrá más de una 
entrada para cada tratamiento y para cada bloque. Se supondrá que en cada posición hay c entradas; en el caso en que 
los números de replicaciones no sean iguales, se hacen las modificaciones apropiadas. 

Debido a la replicación se necesita un modelo adecuado que sustituya al modelo dado por la ecuación (35). Se usa 
el modelo siguiente: 


Xju — A + a j + Pk + Ijk + £ jkl (44) 

donde los subíndices/, k y / deX jW corresponden, respectivamente, al j-ésimo renglón (o tratamientos), a la Pésima 
columna (o bloque) y a laí-ésima repetición (o replicación). En la ecuación (44) fi, a¡ y están definidoscomo antes; 
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Tabla 16.5 


Variación 

Grados de libertad 

Cuadrado medio 

F 

Entre tratamientos, 

V R = bJ2(Xj.-X) 2 
i 

a - 1 

o 2 Vr 

SR ~a-\ 

sl/sl 

con a - 1 y (a - 1) (b - 1) 
grados de libertad 

Entre bloques, 

V c = aJ2(X. k - X) 2 

k 

b - 1 

A2 V c 

Sc ~b- 1 

S 2 c/S 2 e 

con b - 1 y (a - l)(t> - 1) 
grados de libertad 

Residual o aleatoria, 

(a - l)(í> - 1) 

A2 V E 


V E = V-V R -V C 

c 

tí] 

1 

IT 

1 

1 


Total, 

V = v R + v c + V E 

= J2(X jk -X) 2 

j,k 

ab -1 




£¡ k i es un término aleatorio o un término de error, y y ¡k denota los efectos de la interacción renglón-columna (o trata- 
miento-bloque) que se conocen simplemente como interacciones. Se tienen las restricciones 

J2 a í = 0 & = 0 = o Tí* = 0 ( 45 ) 

Í k i k 

y se supone que Ias X jkl están distribuidas de manera normal con media ¡j. y varlanza o 2 . 

Como antes, la variación V de todos los datos puede dividirse en variaciones debidas a los renglones V R , variacio¬ 
nes debidas a las columnas V c , interacciones V, y un error aleatorio o residual V E : 


V — V r -T Ve + Vj + V £ (46) 

donde V = ^ (X jkI - X) 2 (47) 

j,k,l 

V R = bcJ2(Xj..-X) 2 (48) 

j= i 
b 

V c = acJ2(X.k.-X) 2 (49) 

k= 1 

v¡ = C Y, (X Jk . - Xj„ - X k . + X) 2 (50) 

j,k 

V E = J2(X jk ,-Xjk.) 2 (51) 

JXl 


En estos resultados, los puntos que aparecen en los subíndices tienen significados análogos a los dados antes; así, por 
ejemplo, 


Xj: 


~ be 5 Xjkl “¿5 

K,l K 


(52) 


El valor esperado de las vari aciones se encuentra como antes. Empleando, para cada fuente de variación, el número que 
le corresponde de grados de libertad, se puede elaborar una tabla para el análisis de varianza como la que se muestra 
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en la tabla 16.6. Los cocientes F que aparecen en la última columna de la tabla 16.6 se usan para probar las hipótesis 
nulas: 

H { 0 1) \ todas las medias de los tratamientos (renglones) son ¡guales; es decir, a¡ = 0. 

H { 0 2> \ todas las medias de los bloques (columnas) son ¡guales; es decir, (3 k = 0. 

H ¿ 3) : entre tratamientos y bloques no hay interacción; es decir, j jk = 0. 


Tabla 16.6 


Variación 

Grados de libertad 

Cuadrado medio 

F 

Entre tratamientos, 

Vr 

a - 1 

A2 V R 

SR ~a- 1 

S 2 r/S 2 e 

con a - 1 y ab(c - 1) 
grados de libertad 

Entre bloques, 

Ve 

b - 1 

A2 Ve 

Sc ~ b - 1 

Sc/S e 

con b - 1 y ab(c - 1) 
grados de libertad 

Interacción, 

v, 

(a - 1) (¿> - 1) 

Á2 Vj 

1 (a — 1)(A — 1) 

si/s 2 E 

con (a - l)(t> - 1) y 
ab(c - 1) grados de libertad 

Residual o aleatoria, 

V E 

ab(c - 1) 

é2 V E 

E ob(c- 1) 


Total, 

V 

abe - 1 




Desde un punto de vista práctico, hay que decidir primero si //¿ 3) puede o no ser rechazada a nivel de significancia 
apropiado usando el F-cocí ente de la tabla 16.6. Pueden presentarse dos casos: 

1. ^ no puede ser rechazada. En este caso se concluye que las Interacciones no son muy grandes. Entonces, se 
pueden probar y H^ 2) empleando, respectivamente, los F-cocientes S 2 R /Sl y S 2 C /S 2 E como se muestra en la 
tabla 16.6. Algunos especialistas en estadística recomiendan que en este caso se junten las variaciones y se use el 
total V, + V E dividiéndolo éntrela correspondiente suma de grados de libertad (a - l)(b - 1) + ab(c - 1) y usan¬ 
do, en la prueba F, este valor en lugar de s|. 

2. f/ 0 3> puede ser rechazada. En este caso, se concluye que las Interacciones son significativamente grandes. Entonces, 
las diferencias entre los factores sólo serán Importantes si son grandes en comparación con estas Interacciones. A 
esto se debe que muchos especialistas en estadística recomienden probar A/¿ 1) y H (2) empleando los F-cocientes 
Sr/S] y Sc/Sj en lugar de los dados en la tabla 16.6. Aquí también se usará este procedimiento alternativo. 

El análisis de varianza con replicación puede realizarse más fácilmente sumando primero los valores de las repli- 
caclones correspondientes a un tratamiento (renglón) y a un bloque (columna). Con esto se obtiene una tabla de dos 
factores con entrada sencilla, que se puede analizar como la tabla 16.5. Este procedimiento se ¡lustra en el problema 
16.16. 

DISEÑO EXPERIM ENTAL 

Las técnicas de análisis de varianza vistas antes se emplean una vez que se han obtenido los resultados de un experi¬ 
mento. Sin embargo, con objeto de obtener tanta Información como sea posible, es necesario que primero se planee 
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cuidadosamente el experimento; a esto se le conoce como diseño del experimento. Los siguientes son algunos ejemplos 
importantes de diseños de experimentos: 

1. Aleatorización completa. Supóngase que se tiene un experimento agrícola como el del ejemplo 1. Para diseñar 
este experimento se puede dividir la tierra en 4 x 4 = 16 parcelas (como se Indica en la figura 16-1 mediante los 
cuadrados, aunque puede emplearse cualquier otra figura) y asignar cada tratamiento (Indicados por las letras/1, B, 
C y D) a cuatro bloques elegidos en forma completamente aleatoria. El propósito de la aleatorización es eliminar 
diversas fuentes de error, por ejemplo, la fertilidad del suelo. 


D 

A 

C 

C 

B 

D 

B 

A 

D 

C 

B 

D 

A 

B 

C 

A 


Figura 16-1 Aleatorización completa. 


Bloques 

T ratamientos 

1 

C 

B 

A 

D 

II 

4 

B 

D 

C 

III 

B 

C 

D 

A 

IV 

A 

D 

C 

B 


Figura 16-2 Bloquesaleatorizados. 



Factor 1 

Factor 2 

D 

B 

C 

A 

B 

D 

A 

C 

C 

A 

D 

B 

A 

C 

B 

D 


Figura 16-3 Cuadrado latino. 


B 7 

A 0 

D s 

C Q 

A S 

B a 

c 7 

D a 

Da 

c s 

Bp 


C/J 

d 7 

A a 

Bs 


Figura 16-4 Cuadradogrecolatino. 


2. Bloques aleatorizados. Cuando se necesita todo un conjunto de tratamientos para cada bloque, como en el ejemplo 
2, los tratamlentos/l, B, C y D se Introducen en orden aleatorio en cada uno délos bloques I, II, III y IV (esdecir, 
en los renglones de la figura 16-2), y por esta razón a los bloques se les llama bloques aleatorizados. Este tipo de 
diseño se emplea para controlar una fuente de error o variabilidad: a saber, la diferencia entre los bloques. 

3. C uadrados latinos. Para algunos fines es necesario controlar al mismo tiempo dos fuentes de error o de variabi¬ 
lidad, como las diferencias entre los renglones y las diferencias entre las columnas. Por ejemplo, en el experimen¬ 
to del ejemplo 1, los errores en los diferentes renglones y columnas pueden deberse a variaciones en la fertilidad 
del suelo en distintos lugares del terreno. En tal es casos es necesario que cada tratamiento aparezca una vez en cada 
renglón y una vez en cada columna, como en la figura 16-3. A esta distribución se le llama cuadrado latino debido 
a que se emplean las letras A, B, C y D. 

4. C uadrados grecolatinos. Cuando es necesario controlar tres fuentes de error o de variabilidad se emplea un cua¬ 
drado grecolatino, como el que se muestra en la figura 16-4. Estos cuadrados son, en esencia, dos cuadrados latinos 
superpuestos uno sobre otro, usando las letras latí ñas A, B, C y D para uno de los cuadrados y las letras griegas a, 
( 3 ,7 y S para el otro. Un requerimiento adicional por satisfacer es que cada letra griega debe usarse una y sólo una 
vez con cada letra latina; si se satisface esta condición se dice que el cuadrado es ortogonal. 
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PROBLEMAS RESUELTOS 

CLASIFICACIÓN EN UN SENTIDO O EXPERIM ENTOS CON UN FACTOR 
16.1 Probar que 1/ = V w + l/ B ; es decir, 

E - ^) 2 = E i** - +E X - ^) 2 

Á* jA j,k 

SOLUCIÓN 

Se tiene X jk -X={X jk - X } ) + (Z 7 - - Z) 

E levando al cuadrado y sumando sobre j y k, se obtiene 

E {Xjk ~ Z) 2 = E (Z* - Z/.) 2 + E (*;. - ^) 2 + 2 E (Z/fe - Z,,)(Z y . - Z) 

M jA j,k j,k 

Para probar el resultado deseado hay que mostrar que la última suma es cero. Para esto, se procede como sigue: 


E [Xjk ~ Z/.)(Z y -, - Z) = E (Z/. - Z) 




7=1 


*=1 


ya que 


= E(Z;.-Z) 

;=i 

1 A 

x j=-uY. x j 


Í2 (x a xj. 

=i 

E^l ~ bx J 


k= 1 


= 0 


.A 


¿=1 


16.2 Empleando la notación de la página 362, verificar que: a) T = abX, b) T jm = bXj y c) JE- Tj. = a bX. 

SOLUCIÓN 

a) /• E^Á JWxX.ahX 


jA 


b) 


jA 


T j =Y, x ik^ b \- h Y, x A= bx J 


c) Como Tj = J2k x jk . de acuerdo con el inciso a) se tiene 

E t j = E E ^ r =« hx 

Í j k 

16.3 Verificar las fórmulas abreviadas (10), (11) y (12) de este capítulo. 

SOLUCIÓN 

F = E (Z,* - Z) 2 S E (4 - 2ZZ yjt + Z 2 ) 

y,* jA 

= E Z/l — 2Z E x jk + abX 2 
jA jA 

= E x jk - 2 X(abX) + abX 2 

A 


j,k 


= E4-" 2 


j,k 


= T.*i -3 

jA 


Se tiene 
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empleando el problema 16.2a) para el tercero y último renglones anteriores. De Igual manera, 

V B = 


empleando el problema 16.2b) para el tercer renglón y el problema 16.2a) para el último renglón. Por último, la ecuación 
(12) se obtiene a partir de que V = V W + V B o bien V w = V - V B . 

16.4 La tabla 16.7 muestra los rendimientos, en bushels por acre, de cierta variedad de trigo cultivado en un tipo 
especial desuelo tratado con los agentes químicos/), B o C. Encontrar: a) el rendimiento medio con los distin¬ 
tos tratamientos, b) la gran media de todos los tratamientos, c) la variación total, d) la variación entre los tra¬ 
tamientos y e) la variación dentro de los tratamientos. Utilizar el método largo, f) Proporcionar el análisis de 
EXCEL para los datos que se muestran en latabla 16.7. 


E (*/- - x ) 2 = E (*/ 2 - 2 XX i -+ 

j,k j,k 

J2 x l - 2x E x j + ahx2 

E® 2 -^EÍ +^ 2 


j,k 

1 

v- 


j,k 


a b 

¿EE 7 }? - 2 X(abX) + abX 1 


j= 1 k= 1 


í E ^ 2 - abxl 


;= i 


E^ 2 - 


j= i 


ab 


Tabla 16.7 


A 

48 

49 

50 

49 

B 

47 

49 

48 

48 

C 

49 

51 

50 

50 


Tabla 16.8 



SOLUCIÓN 

Para simplificar los cálculos se puede sustraer una cantidad adecuada, por ejemplo 45, de cada uno délos datos sin que esto 
afecte los valores de las variaciones. Así se obtienen los datos de la tabla 16.8. 

a) Las medias de tratamiento (renglón) en la tabla 16.8 son, respectivamente, 

X L =I(3 + 4 + 5 + 4) = 4 X 2 . =i(2 + 4+3 + 3) = 3 Jr 3 . = i (4 + 6 + 5 + 5) = 5 

Y los rendimientos medios, que se obtienen sumando 45 a estos valores, son 49,48 y 50 bushels por acre, respectiva¬ 
mente, para A, B y C. 

b ) La gran media de todos los tratamientos es 

A = -A(3 + 4 + 5-l-4-|-2-|-4-(-3-l-3-l-4-(-6-l-5-i-5) = 4 

Por lo tanto, la gran media del conjunto de los datos originales es 45 + 4 = 49 bushels por acre. 

c) La variación total es 

V = E (Xjk - X) 2 = (3 - 4) 2 + (4 - 4) 2 + (5 - 4) 2 + (4 - 4) 2 + (2 - 4) 2 + (4 - 4) 2 
jk 

+ (3 - 4) 2 + (3 - 4) 2 + (4 - 4) 2 + (6 - 4) 2 + (5 - 4) 2 + (5 - 4) 2 = 14 
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d) La variación entre tratamientos es 

V B = bJ2 <jj. ~ X? = 4[(4 - 4 ) 2 + (3 - 4) 2 + (5 - 4) 2 ] = 8 

j 

e ) La variación dentro de los tratamientos es 


Otro método 


V w = V — V B = 14 — 8 = 6 


V W = Y , ( X Jk - x i ) 2 = (3 - 4) 2 + (4 - 4) 2 + (5 - 4) 2 + (4 - 4) 2 + (2 - 3) 2 + (4 - 3) 2 

j,k 

+ (3 - 3) 2 + (3 - 3) 2 4 - (4 - 5) 2 + (6 - 5) 2 + (5 - 5) 2 + (5 - 5) 2 = 6 


Nota: La tabla 16.9 es para el análisis de varianza de los problemas 16.4,16.5 y 16.6. 


Tabla 16.9 


Variación 

Grados de libertad 

Cuadrado medio 

F 

Entre tratamientos 

V„ = B 

a - 1 = 2 

Si = 1 = 4 

Sí 4 

S 2 W 2/3 1 

Dentro de los tratamientos 



con 2 y 9 grados 
de libertad 

V W = V-V B 
= 14-8 = 6 

a(b-l) = (3)(3) = 9 

Sw ~9~3 

Total 

sb —1 = (3)(4) - 1 



V = 14 

= 11 




f) Empleando EXCEL, la secuencia Tools -» Data analysis -»Anova single factor da el análisis que se presenta a 
continuación. El valor p indica que a = 0.05, las medias de las tres variedades son diferentes. 


A 

B 

C 

48 

47 

49 

49 

49 

51 

50 

48 

50 

49 

48 

50 


Análisis de varianza de un factor 
RESUMEN 


Grupos 

Cuenta 

Suma 

Promedio 

Varianza 

A 

4 

196 

49 

0.666667 

B 

4 

192 

48 

0.666667 

C 

4 

200 

50 

0.666667 


ANÁLISIS DE VARIANZA 


Origen de las 
variaciones 

SS 

df 

MS 

F Valor p 

Entre grupos 

8 

2 

4 

6 0.022085 

Dentro de los grupos 

6 

9 

0.666667 


Total 

14 

11 
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La figura 16-5 muestra una gráfica de puntos de M INITAB dando los rendimientos de las tres variedades de trigo. La 
figura 16-6 muestra una gráfica de caja de M IN ITAB dando los rendimientos de las tres variedades de trigo. El análisis 
de EX CEL y las gráficas de M IN ITA B indican que la variedad C supera significativamente los rendimientos de la varie¬ 
dad B. 


Gráfica de puntos de rendimientos contra tratamiento 


o 

s 

B 


rd 


H 


A -*- 1 -*- 

B - 1 - 3 -*- 

C "I- T-T -f- f - <h 

47 48 49 50 51 


Rendimiento 

Figura 16-5 M I NITAB, gráfica de puntos de los rendimientos de las tres variedades de trigo. 


51 


50 


I 49 

"O 

tí 

o 

48 


Al 

ABC 

Variedad 

Figura 16-6 M I NITAB, gráfica de caja de los rendimientos de las tres variedades de trigo. 


Gráfica de caja de rendimiento contra variedad 



16.5 Volver al problema 16.4, encontrar una estimación ¡nsesgada de la varlanza poblacional o- 2 a partir de: a) la 
variación entre tratamientos bajo la hipótesis nula de medias de tratamiento ¡guales y b ) la variación dentro de 
los tratamientos, c) Consultar los resultados de EXCEL dados en la solución del problema 16.4, localizar las 
estimaciones de las varianzas calculadas en los incisos a) y b). 


SOLUCIÓN 


a) 

b ) 



= 4 


SÍv = 


Vw 

a{b — 1 ) 


6 

3(4^T) 


2 

3 


c) La estimación de varianza s\, en los resultados de EXCEL, es MS entre grupos y es 4, que es igual al valor encontrado. 

La estimación deS^, en los resultados de EXCEL, es MS dentro de los grupos y es 0.666667, que es igual al 
valor encontrado. 


16.6 Dados los datos del problema 16.4, a los niveles de significancia: a) 0.05 y b) 0.01, ¿puede rechazarse la hipó¬ 
tesis nula de medias ¡guales? c) Consultar los resultados de EXCEL dados en la solución del problema 16.4, 
para probar la hipótesis nula de varianzas ¡guales. 
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SOLUCIÓN 

Se tiene 


F = 


s 2 w 2/3 


= 6 


con a - 1 = 3 - 1 grados de libertad y a(b - 1) = 3(4 - 1) = 9 grados de libertad. 

a) En el apéndice V, para v 1 == 2 y v 2 = 9, se encuentra queF 95 = 4.26. Como F = 6 > F 95 , la hipótesis nula de medias 
iguales puede rechazarse al nivel 0.05. 

b ) En el apéndice VI, para ^ = 2 y ¡^«9, se encuentra queF 99 = 8.02. Como F = 6 < F 99 , la hipótesis nula de medias 
iguales no se puede rechazar al nivel 0.01. 

c) Consultando los resultados de EXCEL dados en el problema 16.4, se encuentra que el valor F es 6 y el valor p es 0.022. 
Por lo tanto, el menor nivel de significancia predeterminado al que puede rechazarse la hipótesis nula es 0.022. De 
manera que la hipótesis nula se rechazará al nivel de significancia 0.05, pero no al nivel de significancia 0.01. 


16.7 Dados los datos del problema 16.4, emplear las fórmulas abreviadas (10), (11) y (12) para obtener: a) la varia¬ 
ción total, b) la variación entre los tratamientos y c) la variación dentro de los tratamientos. Además, utilizar 
M INITAB con los datos, a los que se les restó 45 a cada valor, para obtener la tabla del análisis de varianza. 

SOLUCIÓN 

Conviene ordenar los datos como en la tabla 16.10. 


Tabla 16.10 



Tj 

Tj- 

A 

3 

4 

5 

4 

16 

256 

B 

2 

4 

3 

3 

12 

144 

C 

4 

6 

5 

5 

20 

400 


E 

j,k 

x% 

= 

206 

T = V T¡. = 48 
j 

oí 

. LO 

II 

oo 

o 

o 


a) Usando la fórmula (10), se tiene 

J2 x fk = 9 + 16 + 25 + 16 + 4 + 16 + 9 + 9 + 16 + 36 + 25 + 25 = 206 
y T = 3 + 4+ 5 + 4 + 2 + 4 + 3 + 3 + 4 + 6 + 5 + 5 = 48 

r r 2 ( 40\2 

Por lo tanto, V = V Xi - — = 206 - /-A- = 206 - 192 = 14 

' ab (3) (4) 

b ) Los totales (suma) de los renglones son 

T l = 3 + 4 + 5 + 4=16 T 2 . =2 + 4 + 3 + 3=12 r 3 . =4 + 6 + 5 + 5 = 20 

y T= 16+ 12 + 20 = 48 

Por lo tanto, empleando la fórmula (11), se tiene 

v *** ^-S = 4 (162 + 122 + 2o2) -M = 20 °- 192 = 8 

c) Empleando lafórmula (12), se tiene 


V w = V - V B = 14 — 8 = 6 
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Estos resultados coinciden con los obtenidos en el problema 16.4 y se procede como antes. 

Con la secuencia Stat ^ Anova -> Oneway se obtiene el resultado siguiente. Obsérvense las diferencias en la ter¬ 
minología empleada. A la variación dentro de los tratamientos se le llama en EXCEL De n t r o de los grupos yen 
MINITABError.A la variación entre tratamientos en EXCEL se le I lama E n t re los grupos yenMINITABFactor. 
El usuario debe acostumbrarse a las diferentes terminologías empleadas en los diversos paquetes de software. 


One-way ANOVA: A, B, C 


Source 

DF 

SS 

MS 

F P 

Factor 

2 

8.000 

4.000 

6.00 0.022 

Error 

9 

6.00 

0.667 


Total 

11 

14.000 



S=0.8165 


R-Sq=57 

. 14% 

R-Sq(adj)=47.62% 


16.8 Una empresa quiere comprar una de cinco máquinas A, B, C, D oE.Enun experimento destinado a probar si 
hay diferencia en el rendimiento de estas máquinas, uno de cada cinco operadores experimentados trabaja 
durante la misma cantidad de tiempo en cada máquina. En la tabla 16.11 se muestra la cantidad de unidades 
producidas con cada máquina. A los niveles de significancia: a) 0.05 y b) 0.01, probar la hipótesis de que no 
hay diferencia éntrelas máquinas, c) Proporcionarla solución deSTATISTIX a este problema, y empleando el 
método del valorp, probar la hipótesis deque no hay diferencia éntrelas máquinas. Usar a = 0.05. 


Tabla 16.11 


A 

68 

72 

77 

42 

53 

B 

72 

53 

63 

53 

48 

C 

60 

82 

64 

75 

72 

D 

48 

61 

57 

64 

50 

E 

64 

65 

70 

68 

53 


Tabla 16.12 



Tj- 

Tj- 

A 

8 

12 

17 

-18 

-7 

12 

144 

B 

12 

-7 

3 

-7 

-12 

-11 

121 

C 

0 

22 

4 

15 

12 

53 

2 809 

D 

-12 

1 

-3 

4 

-10 

-20 

400 

E 

4 

5 

10 

8 

-7 

20 

400 




2 

k ~ 

2 658 


54 

3 874 


SOLUCIÓN 

A cada dato se le resta un número adecuado, por ejemplo 60, y se obtiene la tabla 16.12. Entonces 


(54) 

\/ = 2 658 — = 2 658 — 116.64 = 2 541.36 


V B = El) = 774.8 - 116.64 = 658.16 


Ahora se elabora la tabla 16.13. Para 4 y 20 grados de libertad, se tiene F 95 = 2.87. De esta manera, al nivel 0.05 no 
se puede rechazar la hipótesis nula y, por lo tanto, tampoco al nivel 0.01. 

Con la secuencia Stati stics —> One, two, multi-sample tests -> One-way A nova se obtiene el resultado siguiente. 
























420 Capítulo 16 Análisis de varianza 


Statistix 8 . 

One-Way AOV for: A B C D E 


Source 

DF 

SS 

MS 

F 

P 

Between 

4 

658.16 

164.540 

1.75 

0.1792 

Within 

20 

1883.20 

94.160 



Total 

24 

2541.36 




Grand Mean 62.160 

CV 15.61 





Variable Mean 

A 62.400 

B 57.800 

C 70.600 

D 56.000 

E 64.000 

El valor p es 0.1792. No hay diferencia significativa entre las medias poblacionales. 


Tabla 16.13 


Variación 

Grados de libertad 

Cuadrado medio 

F 

Entre tratamientos, 

V B = 658.2 

a - 1 = 4 

Sb = 65 ^' 2 = 164.5 

_ 16 4.55 _ 

94.16 

Dentro de tratamientos, 

V w = 1 883.2 

a(b-l) = (5)(4) = 20 

= 1 8832 = 94.16 
b w 20 


Total, 

V = 2 514.4 

ah - 1 = 24 




MODIFICACIONES PARA NÚM EROS DISTI NTOS DE OBSERVACIONES 

16.9 En la tabla 16.14 se presentan las duraciones, en horas, de muestras de tres diferentes tipos de cinescopios 
producidos por una empresa. U sando el método largo, a los niveles de significancia: a) 0.05 y b) 0.01, deter¬ 
minar si hay alguna diferencia entre los tres tipos de cinescopios. 


Tabla 16.14 


M uestra 1 

407 411 409 

M uestra 2 

404 406 408 405 402 

M uestra 3 

410 408 406 408 


SOLUCIÓN 

Para facilitar los cálculos se resta de cada dato un número apropiado, por ejemplo 400, obteniendo así la tabla 16.15. En 
esta tabla se dan los totales de los renglones, las medias muéstrales (o grupales) y la gran media. De esta manera se tiene 
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V=J2 ( Z A - xf = (7 - 7) 2 + (11 - 7) 2 + ■ • • + (8 - 7) 2 = 72 
jjk 

v b = J 2 w - - ^) 2 = J 2 n á * j - - Jf ) 2 = 3 ( 9 - 7 ) 2 + 5 ( ? - 5 ) 2 + 4 ( 8 - 7 ) 2 = 36 

j,k j 

Vw = v - = 72 - 36 = 36 

V w también puede obtenerse directamente observando que es igual a 

(7 — 9) 2 + (1 1 — 9) 2 + (9 - 9) 2 + (4 - 5) 2 + (6 - 5) 2 + (8 - 5) 2 + (5 - 5) 2 
+ (2 - 5) 2 + (10 - 8) 2 + (8 - 8) 2 + (6 - 8) 2 + (8 - 8) 2 


Tabla 16.15 



Total 

M edla 

M uestra 1 

7 11 9 

27 

9 

M uestra 2 

4 6 8 5 2 

25 

5 

M uestra 3 

10 8 6 8 

32 

8 


X = gran media = 7 


Los datos pueden resumirse como en la tabla 16.16, la tabla para el análisis de varianza. Para 2 y 9 grados de libertad, 
en el apéndice V se encuentra que F 95 = 4.26 y en el apéndice V1 que F g9 = 8.02. Por lo tanto, la hipótesis de que 
las medias son ¡guales (es decir, que no hay diferencia entre los tres tipos de cinescopios) puede rechazarse al nivel de 
significancia 0.05, pero no al nivel de significancia 0.01. 


Tabla 16.16 


Variación 

Grados de libertad 

Cuadrado medio 

F 

V b =36 

a - 1 = 2 

36 

^ = y =18 

S¡_ 18 
ó 2 4 

= 4.5 

V w = 36 

N -a = 9 

A2 36 
•V-y-4 


16.10 Resolver el problema 16.9 empleando las fórmulas abreviadas (24), (25) y (26). Además, proporcionarla solu¬ 
ción al problema empleando SAS. 

SOLUCIÓN 

De acuerdo con la tabla 16.15, se tiene A/ : = 3, W 2 = 5, W 3 = 4, Al = 12, T L = 27, T 2 = 25, T 3 = 32 y T = 84. Por lo tanto, 
se tiene 


v=T, x *-Y =l2+n2+ 




+ 6 2 + 8 2 -M- 


„ Tj. T 2 (27) 2 , (25) 2 , (32) 2 

B X* N: N 3 + 5 + 4 


(84T 

12 


= 72 

36 


V w m V - V B = 36 


Empleando estos valores, el análisis de varianza procede entonces como en el problema 16.9. 
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Empleando SAS, con la secuencia Statistics -* ANOVA —> Oneway ANOVA se obtienen los resultados 
siguientes. 

The ANOVA Procedure 

Class Level Information 
Class Levels Valúes 

Sample_ 3 123 

Number of Observations Read 12 
Number of Observations Used 12 

The ANOVA Procedure 

Dependent Variable: lifetime 


Source 

DF 

Sum of Squares 

Mean Square 

F valué 

Pr > F 

Model 

2 

36.00000000 

18.00000000 

4.50 

0.0442 

Error 

9 

36.00000000 

4.00000000 



Corrected Total 

11 

72.00000000 






R-Square 

coeff Var 

Root MSE 

lifetime Mean 



0.500000 

0.491400 

2.000000 

407.0000 

Source 

DF 

Anova SS 

Mean Square 

F Valué 

Pr > F 

Sample_ 

2 

36.00000000 

18.00000000 

4.50 

0.0442 


Obsérvese que en SAS a la variación entre tratamientos se le llama mo d e I (modelo) y a la variación dentro de 
los tratamientos se le dice e r r o r .Al estadístico de prueba se le llama valor F y es igual a 4.50. El valor p es Pr > F 
y es igual a 0.0442. A a = 0.05 se declarará que las duraciones no son ¡guales. 


CLASIFICACIÓN EN DOSSE NUDOSO EXPERIMENTOS CON DOSFACTORES 

16.11 En la tabla 16.17 se presenta la producción por aereen cuatro cultivos diferentes empleando tres tipos diferen¬ 
tes de fértil Izantes. Usando el método largo, determinar, al nivel de significancia 0.01, si hay diferencias en la 
producción por acre: a) debidas a los fertilizantes y b) debidas a los cultivos, c) Proporcionar la solución que 
da M INITA B a este experimento de dos factores. 

SOLUCIÓN 

Como se muestra en la tabla 16.18, se calculan los totales de los renglones, las medias de los renglones, los totales de 
las columnas, las medias de las columnas, el gran total y la gran media. Según esta tabla se obtiene: 

La variación de las medias de los renglones respecto a la gran media es 

V R = 4[(6.2 - 6.8) 2 + (8.3 - 6.8) 2 + (5.9 - 6.8) 2 ] = 13.68 
La variación de las medias de las columnas respecto a la gran media es 

V c = 3[(6.4 - 6.8) 2 + (7.0 - 6.8) 2 + (7.5 - 6.8) 2 + (6.3 - 6.8) 2 ] = 2.82 


Tabla 16.17 



Cultivo 1 

Cultivo II 

Cultivo III 

Cultivo IV 

Fértil Izante A 

4.5 

6.4 

7.2 

6.7 

Fertilizantes 

8.8 

7.8 

9.6 

7.0 

Fertilizante C 

5.9 

6.8 

5.7 

5.2 
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Tabla 16.18 



Cultivo 1 

Cultivo II 

Cultivo III 

Cultivo IV 

Total del 
renglón 

M edia del 
renglón 

Fértil izante A 

4.5 

6.4 

7.2 

6.7 

24.8 

6.2 

Fertilizantes 

8.8 

7.8 

9.6 

7.0 

33.2 

8.3 

Fertilizante C 

5.9 

6.8 

5.7 

5.2 

23.6 

5.9 

Total de la columna 

19.2 

21.0 

22.5 

18.9 

Gran total = 81.6 

M edia de la columna 

6.4 

7.0 

7.5 

6.3 

Gran media = 6.8 


La variación total es 


V = (4.5 - 6.8) 2 + (6.4 - 6.8) 2 + (7.2 - 6.8) 2 + (6.7 - 6.8) 2 

+ (8.8 - 6.8) 2 + (7.8 - 6.8) 2 + (9.6 - 6.8) 2 + (7.0 - 6.8) 2 

+ (5.9 - 6.8) 2 + (6.8 - 6.8) 2 + (5.7 - 6.8) 2 + (5.2 - 6.8) 2 = 23.08 

La variación aleatoria es 


V E = V - V R - V c = 6.58 
Esto conduce al análisis de varlanza de la tabla 16.19. 


Tabla 16.19 


Variación 

Grados de 
libertad 

Cuadrado medio 

F 

V R = 13.68 

2 

S\ = 6.84 

S 2 r /S 2 e = 6.24 

con 2 y 6 grados 
de libertad 

V c = 2.82 

3 

S 2 C = 0.94 

S 2 c /S 2 e = 0.86 
con 3 y 6 grados 
de libertad 

V E = 6.58 

6 

S 2 e = 1.097 


V = 23.08 

11 




a) Al nivel de significancia 0.05 con 2 y 6 grados de libertad, F g5 = 5.14. Entonces, como 6.24 >5.14, se puede rechazar 
la hipótesis de que las medias de los renglones sean iguales y concluir que al nivel de significancia 0.05 existe, en la 
producción, una diferencia significativa debida a los fertilizantes. 

b) Como el valor F correspondiente a las diferencias en las medias de las columnas es menor que 1, se concluye que 
debido a los cultivos no hay diferencia significativa en la producción. 

c) Primero se da la estructura que deben tener los datos en la hoja de cálculo de M INITAB, y a continuación el análisis 
de M INITAB para este experimento de dos factores. 
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ow 

Crop 

Fertilizer 

Yield 

1 

1 

1 

4.5 

2 

1 

2 

8.8 

3 

1 

3 

5.9 

4 

2 

1 

6.4 

5 

2 

2 

7.8 

6 

2 

3 

6.8 

7 

3 

1 

7.2 

8 

3 

2 

9.6 

9 

3 

3 

5.7 

10 

4 

1 

6.7 

11 

4 

2 

7.0 

12 

4 

3 

5.2 


MTB > Twoway 'Yield' 'Crop' 'Fertilizer ' ; 
SUBC >Means 'Crop' 'Fertilizer ' . 


Two-way Analysis of Variance 


Analysis of Variance for Yield 


Source 

DF 

SS 

MS 

F 

P 

Crop 

3 

2.82 

0.94 

0.86 

0.512 

Fertiliz 

2 

13.68 

6.84 

6.24 

0.034 

Error 

6 

6.58 

1.10 



Total 

11 

23.08 





Crop 

1 

2 

3 

4 


Individual 95% CI 

Mean — +-+-+-+-■ 

6.40 (-*-) 

7.00 (-*-) 

7.50 (-*- 

6.30 (-*-) 

— + - + - + - + -- 

5.00 6.00 7.00 8.00 


Fertiliz Mean 
1 6.20 

2 8.30 

3 5.90 


Individual 95% CI 



( - * - ) 

— + - + - + - + - 

4.80 6.00 7.20 8.40 


) 


) 


L a estructura de los datos en la hoja de cálculo debe corresponder exactamente a la estructura de los datos en la tabla 
16.17. El primer renglón, 114.5, corresponde a Cultivo 1, Fertilizante 1 y Rendimiento 4.5; el segundo renglón, 128.8, 
corresponde a Cultivo 1, Fertilizante 2 y Rendimiento 8.8, etc. U n error frecuente al usar software para estadística es que 
en la hoja de cálculo se dé una estructura incorrecta de los datos. Hay que asegurarse de que los datos dados en una tabla 
como la 16.17 y la estructura de los datos en la hoja de cálculo se correspondan uno a uno. Obsérvese que la tabla para el 
análisis de varianza en dos sentidos, dada en los resultados de M INITAB, contiene la información de la tabla 16.19. Los 
valoresp que aparecen en los resultados de M IN ITAB permiten al investigador probar la hipótesis de interés sin tener que 
consultar las tablas de la distribución F para hallar los valores críticos. El valor p para los cultivos es 0.512. Éste es el nivel 
de significancia mínimo al que se puede rechazar que haya diferencia en la producción media de los cultivos. Las produc¬ 
ciones medias de los cuatro cultivos no son estadísticamente significativas a 0.05 o bien 0.01. El valorp para los fértil izan¬ 
tes es 0.034. Esto indica que las producciones medias con los tres fertilizantes son estadísticamente diferentes a 0.05 pero 
no a 0.01. 

Los intervalos de confianza para las medias de los cuatro cultivos dados en los resultados de M IN ITAB refuerzan la 
conclusión de que no hay diferencia en las producciones medias de los cuatro diferentes cultivos. Los intervalos de con¬ 
fianza para los tres fertilizantes indican que posiblemente con el fertilizante B se obtenga una producción media más alta 
que con cualquiera de los fertilizantes A o bien C. 
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16.12 Usar la fórmula de cálculo abreviada para resolver el problema 16.11. Además, proporcionarla solución a este 
problema empleando SPSS. 

SOLUCIÓN 


De acuerdo con la tabla 16.18, se tiene 


Entonces 


Y Xfk = (4-5) 2 + (6.4) 2 + • ■ ■ + (5.2) 2 = 577.96 
j,k 

T = 24.8 + 33.2 + 23.6 = 81.6 

Y Ti = (24.8) 2 + (33.2) 2 + (23.6) 2 = 2 274.24 

Y T 2 k = (19.2) 2 + (21.0) 2 + (22.5) 2 + (18.9) 2 = 1 673.10 


V 


J2 x fk- 


Y 

ab 


= 577.96 - 554.88 = 23.08 


1 T 1 1 

Vo = - V T¡ - — = - (2 274.24) - 554.88 = 13.68 
J ab 4 ' 

1 7" 2 1 

V c =-Y T\-—r = -{ 1 673.10) - 554.88 = 2.82 
L a K ab 3 v ' 

V E = V - V R - V c = 23.08 - 13.68 - 2.82 = 6.58 


Lo cual coincide con los resultados del problema 16.11. 

Con la secuencia A nalyze—> General Linear Model —>■ UnivariatedeSPSS se obtienen los resultados siguientes: 


Pruebas de efectos entre temas 


Variable dependiente: rendimiento 


Origen 

Tipo 1: suma 
de cuadrados 

df 

Cuadrado medio 

F 

Sig. 

Modelo correcto 

16.500 a 

5 

3.300 

3.009 

.106 

Intercepto 

554.880 

1 

554.880 

505.970 

.000 

Cultivo 

2.820 

3 

.940 

.857 

.512 

Fertilizante 

13.680 

2 

6.840 

6.237 

.034 

Error 

6.580 

6 

1.097 



Total 

577.960 

12 




Total corregido 

23.080 

11 





a R cuadrada = .715 (R cuadrada ajustada = .477) 


Obsérvese que el estadístico de prueba está dado por F y que para los cultivos el valor F es 0.857 y el correspon¬ 
diente valorp esO.512. El valor F para fértil Izante es 6.237 y el correspondiente valorp es 0.034. Estos valores corres¬ 
ponden a los valores de la tabla 16.19, así como a los resultados dados por M INITA B en el problema 16.11. 


EXPERIMENTOS CON DOS FACTORES CON REPLICACIÓN 

16.13 Un fabricante desea determinar la efectividad de cuatro tipos de máquinas ( A, B, C y D) en la producción de 
tornillos. Para esto, obtiene la cantidad de tornillos defectuosos producidos por cada máquina durante los días 
de una semana determinada en cada uno de los dos turnos; los resultados se muestran en la tabla 16.20. Realizar 
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un análisis de varianza para determinar, al nivel de significancia 0.05, si existe alguna diferencia: a) entre las 
máquinas y b ) entre los turnos, c) Utilizar también M INITAB para realizar el análisis de varianza y probar las 
diferencias entre las máquinas y entre los turnos usando un valor p apropiado. 


Tabla 16.20 



Primer turno 

Segundo turno 

M áqulna 

Lunes 

M artes 

M ¡ércoles 

J ueves 

Viernes 

Lunes 

M artes 

M ¡ércoles 

J ueves 

Viernes 

4 

6 

4 

5 

5 

4 

5 

7 

4 

6 

8 

B 

10 

8 

7 

7 

9 

7 

9 

12 

8 

8 

C 

7 

5 

6 

5 

9 

9 

7 

5 

4 

6 

D 

8 

4 

6 

5 

5 

5 

7 

9 

7 

10 


SOLUCIÓN 

Los datos también se pueden organizar de manera equivalente, como en la tabla 16.21. En esta tabla se indican los dos 
factores principales: la máquina y el turno. Obsérvese que se han indicado dos turnos por cada máquina. Los días de la 
semana pueden considerarse como réplicas (o repeticiones) del desempeño de cada máquina en los dos turnos. La variación 
total de todos los datos de la tabla 16.21 es 


V 

= 6 2 + 4 2 + 5 2 

+ ■ • • + 7 2 

+ 10 2 - 

Tabla 

(268)2 1 916 

- 1 795.6 

= 150.4 


40 1 y4b 

L6.21 

Factor 1: 

Factor II: 

Réplicas 


M áqulna 

Turno 

Lunes 

M artes 

M ¡ércoles 

J ueves 

Viernes 

Total 

A 

/I 

6 

4 

5 

5 

4 

24 


l 2 

5 

7 

4 

6 

8 

30 

D 

/I 

10 

8 

7 

7 

9 

41 


l 2 

7 

9 

12 

8 

8 

44 

r 

/I 

7 

5 

6 

5 

9 

32 

L 

l 2 

9 

7 

5 

4 

6 

31 

n 

/I 

8 

4 

6 

5 

5 

28 


l 2 

5 

7 

9 

7 

10 

38 


Total 

57 

51 

54 

47 

59 

268 


Con el fin de considerar los dos factores principales (la máquina y el turno), se concentra la atención en la suma de 
los valores de las réplicas correspondientes a cada combinación de los factores. Éstas se presentan en la tabla 16.22, que 
es, por lo tanto, una tabla de dos factores con entradas sencillas. La variación total en la tabla 16.22, a la que se le llamará 
variación subtotal V s , está dada por 


tt (24) 2 , (41) 2 , (32) 2 , (28) 2 , (30) 2 , (44) 2 , (31) 2 , (38) 2 (268) 2 

V s - —r- + — 4 - 


= 1 861.2 - 1 795.6 = 65.6 


5 


5 


5 


40 
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La variación entre renglones está dada por 

_ ( 54) 2 ( 85) 2 ( 63) 2 ( 66) 2 ( 268) 2 

R 10 10 10 10 40 


846.6 - 1 795.6 = 51.0 


Tabla 16.22 


M áqulna 

Primer turno 

Segundo turno 

Total 

A 

24 

30 

54 

B 

41 

44 

85 

C 

32 

31 

63 

D 

28 

38 

66 

Total 

125 

143 

268 


La variación entre columnas está dada por 

T . _ ( 125) 2 , ( 143) 2 ( 268) 2 
— 20 20 40 


803.7 — 1 795.6 ®s 8.1 


Si de la variación subtotal V s se resta ahora la suma de las variaciones entre renglones y las variaciones entre columnas 
(V R + V c ), se obtiene la variación debida a la interacción entre renglones y columnas, la cual está dada por 


V¡ = V s — V R — V c = 65.6 - 51.0 - 8.1 = 6.5 

Por último, se obtiene la variación residual, que puede considerarse como una variación aleatoria o variación por error V E 
(siempre que se crea que los diferentes días de la semana no ocasionan diferencia importante), esta variación se encuentra 
restando la variación subtotal (es decir, la suma de las variaciones de renglón, de columna y de Interacción) de la variación 
total V. Esto da 


V E = V - {V R + V c + Vj) = V - V s = 150.4 - 65.6 = 84.8 

Estas variaciones se muestran en la tabla 16.23, la tabla para el análisis de varianza. En esta tabla también se da el 
número de grados de libertad que corresponde a cada tipo de variación. Por lo tanto, dado que en la tabla 16.22 hay cuatro 


Tabla 16.23 


Variación 

Grados de 

1 i bertad 

Cuadrado medio 

F 

Renglones (máquinas), 

V R = 51.0 

3 

S 2 r = 17.0 


Columnas (turnos), 

V c = 8.1 

1 

¿I = 8.1 

Sr- 

Interacción, 

V, = 6.5 

3 

Sj = 2.167 


Subtotal, 

V s = 65.6 

7 



Aleatoria o residual, 

V E = 84.8 

32 

Si = 2.65 

Total, 

1/ = 150.4 

39 
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renglones, la variación debida a los renglones tiene 4-1 = 3 grados de libertad, la variación debida a las dos columnas 
tiene2 — 1 = 1 grado de libertad. Para hallar los grados de libertad debidos a la interacción, se observa que en la tabla 16.22 
hay ocho entradas; por lo tanto, el total de grados de libertad es 8 - 1 = 7. Como 3 de estos 7 grados de libertad se deben 
a los renglones y 1 se debe a las columnas, el resto [7 - (3 + 1) = 3] se debe a la interacción. Dado que en la tabla original 
16.21 hay 40 entradas, el total de grados de libertad es 40 - 1 = 39. De esta manera, los grados de libertad debidos a la 
variación aleatoria o residual son 39 - 7 = 32. 

Primero debe determinarse si hay alguna interacción significativa. El valor crítico interpolado de la distribución F 
con 3 y 32 grados de libertad es 2.90. El valor F calculado para la interacción es 0.817 y no es significativo. Entre las 
máquinas hay una diferencia significativa, ya que el valor F calculado para las máquinas es 6.42 y el valor crítico es 2.90. 
El valor crítico para los turnos es 4.15. El valor F calculado para los turnos es 3.06. N o hay diferencia en los defectos 
debida a los turnos. 

A continuación se muestra la estructura que deben tener los datos en la hoja de cálculo de M INITAB. Compárese la 
estructura de los datos con los de la tabla 16.21 para ver la relación entre los dos conjuntos de datos. 


Row 

1 

2 

3 

4 

5 

6 

7 

8 
9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 
21 
22 

23 

24 

25 

26 

27 

28 

29 

30 

31 

32 

33 

34 

35 

36 

37 

38 

39 

40 


Machine 

1 

1 

1 

1 

1 

1 

1 

1 

1 

1 

2 

2 

2 

2 

2 

2 

2 

2 

2 

2 

3 

3 

3 

3 

3 

3 

3 

3 

3 

3 

4 
4 
4 
4 
4 
4 
4 
4 
4 
4 


Shif t 
1 
1 
1 
1 
1 
2 
2 
2 
2 
2 
1 
1 
1 
1 
1 
2 
2 
2 
2 
2 
1 
1 
1 
1 
1 
2 
2 
2 
2 
2 
1 
1 
1 
1 
1 
2 
2 
2 
2 
2 


Defects 
6 

4 

5 
5 

4 

5 

7 

4 

6 

8 

10 

8 

7 

7 

9 

7 
9 

12 

8 
8 
7 

5 

6 
5 
9 
9 

7 

5 
4 

6 

8 

4 
6 

5 
5 
5 
7 
9 
7 

10 


Con el comando MT B < T wo wa y ' Def ec t s' 'Machine' 'Shifts' se obtiene el análisis de varianza en dos 
sentidos. El valorp para la interacción es 0.494. Éste es el nivel de significancia mínimo para rechazar la hipótesis nula; es 
claro que no hay una interacción significativa entre turnos y máquinas. Para los turnos, el valorp es 0.090; como este valor 
es mayor que 0.050, la cantidad media de defectos en los dos turnos no es significativamente diferente. Para las máquinas, 
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el valor p es 0.002; al nivel de significancia 0.050, las cantidades medias de defectos en las cuatro máquinas son notable¬ 
mente diferentes. 

MTB > Twoway 'Defects' 'Machine' 'Shift' 

Two-way Analysis of Variance 


Analysis of Variance for Defects 


Source 

DF 

SS 

MS 

F 

P 

Machine 

3 

51.00 

17.00 

6.42 

0.002 

Shift 

1 

8.10 

8.10 

3.06 

0.090 

Interaction 

3 

6.50 

2.17 

0.82 

0.494 

Error 

32 

84.80 

2.65 



Total 

39 

150.40 





En la figura 16-7 se presenta la gráfica de la interacción entre turnos y máquinas. La gráfica indica que hay una 
posible interacción entre turnos y máquinas. Sin embargo, en la tabla del análisis de varianza el valor p de esta interacción 
indica que no hay una interacción significativa. Cuando no hay interacción, las gráficas del turno 1 y del turno 2 son para¬ 
lelas. En la figura 16-8, las gráficas de los efectos principales indican que, en este experimento, la máquina 1 fue la que 
produjo en promedio menos tornillos defectuosos y la máquina 2 fue la que produjo más tornillos defectuosos; se produje¬ 
ron más defectuosos en el turno 2 que en el turno 1. Sin embargo, el análisis de varianza indica que esta diferencia no es 
significativa. 

Turno 



Figura 16-7 G ráfica de la interacción: medias de los datos para defectuosos. 


Máquina Tumo 



Figura 16-8 Gráfica de los efectos principales: medias de los datos para defectuosos. 
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16.14 Resolver el problema 16.13 empleando EXCEL. 

SOLUCIÓN 


A 

B 

C 

D 

E 


máquinal 

máquina2 

máquina3 

máquina4 


turnol 

6 

10 

7 

8 


turnol 

4 

8 

5 

4 


turnol 

5 

7 

6 

6 


turnol 

5 

7 

5 

5 


turnol 

4 

9 

9 

5 


turno2 

5 

7 

9 

5 


turno2 

7 

9 

7 

7 


turno2 

4 

12 

5 

9 


turno2 

6 

8 

4 

7 


turno2 

8 

8 

6 

10 


Análisis de varianza de dos factores con una sola muestra por grupo 


RESUMEN máquinal 

máquina2 

máquina3 

máquina4 

Total 

turnol 






Cuenta 

5 

5 

5 

5 

20 

Suma 

24 

41 

32 

28 

125 

Promedio 

4.8 

8.2 

6.4 

5.6 

6.25 

Varianza 

0.7 

1.7 

2.8 

2.3 

3.25 

turno2 






Cuenta 

5 

5 

5 

5 

20 

Suma 

30 

44 

31 

38 

143 

Promedio 

6 

8.8 

6.2 

7.6 

7.15 

Varianza 

2.5 

3.7 

3.7 

3.8 

4.239474 

Total 






Cuenta 

10 

10 

10 

10 


Suma 

54 

85 

63 

66 


Promedio 

5.4 

8.5 

6.3 

6.6 


Varianza 1.822222 

2.5 

2.9 

3.822222 


ANÁLISIS DE VARIANZA 





Origen de 
las variaciones 

SS 

df 

MS 

F 

Valor p 

Muestra 

8.1 

1 

8.1 

3.056604 

0.089999 

Columnas 

51 

3 

17 

6.415094 

0.001584 

Interacción 

6.5 

3 

2.166667 

0.81761 

0.49371 

Dentro del grupo 

84.8 

32 

2.65 



Total 

150.4 

39 





*SS, Suma de cuadrados; df, grados de libertad; MS, promedio de los cuadrados; F, probabilidad. 


Los datos se ingresan en la hoja de cálculo de EXCEL, como se muestra. Con la secuencia Tools ->• Data 
analysis-> Anova: Two-Factor with Replication se obtiene el cuadro de diálogo de la figura 16-9 que se llena como 
se muestra en la figura. 
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Figura 16-9 EXCEL, cuadro de diálogo para el problema 16.14. 


En el análisis de varianza, muestra corresponde a turnos, y columna a máquinas. Comparar estos resultados con 
los obtenidos con M INITA B en el problema 16.13. 

CUADRADOS LATINOS 

16.15 Un granjero desea probar los efectos de cuatro fertilizantes (A, B, C y D) en la producción de trigo. Con objeto 
de eliminar las fuentes de error debidas a la variabilidad de la fertilidad del suelo, distribuye los fertilizantes 
en un cuadrado latino, como se muestra en la tabla 16.24, en donde los números Indican la producción en 
bushels por unidad de área. H acer un análisis de varianza para determinar, a los niveles de significancia a) 0.05 
y b) 0.01, si hay diferencia entre los fértil Izantes, c) Proporcionar la solución de M IN ITA B para este diseño de 
cuadrado latino, d) Proporcionar la solución deSTATISTIX para este diseño de cuadrado latino. 

SOLUCIÓN 

Primero, como se muestra en la tabla 16.25, se obtienen los totales de los renglones y los totales de las columnas. También 
se obtiene la producción total obtenida con cada uno de los fértil izantes, como se muestra en la tabla 16.26. Después, como 
es costumbre, se obtienen la variación total y las variaciones de los renglones, de las columnas y de los tratamientos. Se 
encuentra que: 

La variación total es 


V = (18) 2 + (21) 2 + (25) 5 + ■ ■ ■ + (10) 2 + (17) - 

lo 

= 5 769 - 5 439.06 = 329.94 


Tabla 16.24 


A 18 

C 21 

D 25 

B 11 

D 22 

B 12 

A 15 

C 19 

B 15 

A 20 

C 23 

D 24 

C 22 

D 21 

B 10 

A 17 


Tabla 16.25 






Total 


A 18 

C 21 

D 25 

B 11 

75 


D 22 

B 12 

A 15 

C 19 

68 


B 15 

A 20 

C 23 

D 24 

82 


C 22 

D 21 

B 10 

A 17 

70 

Total 

77 

74 

73 

71 

295 
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Tabla 16.26 



A 

B 

C 

D 


Total 

70 

48 

85 

92 

295 


La variación entre los renglones es 


„ ( 75) 2 , ( 68) 2 , ( 82) 2 , ( 70) 2 ( 295) 2 

-16 

= 5 468.25 - 5 439.06 = 29.19 


La variación entre las columnas es 


v _ ( 77) 2 ( 74) 2 ( 73) 2 ( 71) 2 ( 295) 2 

C 4 4 4 4 16 

= 5 443.75 - 5 439.06 = 4.69 


La variación entre los tratamientos es 


+ íltf + M + !^!_mi _5,23.25 - 5439.06„284.19 
4 4 4 4 16 


En la tabla 16.27 se muestra el análisis de varianza. 


Tabla 16.27 


Variación 

Grados de 
libertad 

Cuadrado medio 

F 

Renglones, 29.19 

3 

9.73 

4.92 

Columnas, 4.69 

3 

1.563 

0.79 

Tratamientos, 284.19 

3 

94.73 

47.9 

Residuales, 11.87 

6 

1.978 


Total, 329.94 

15 




a) Como F 95 3 6 = 4.76, la hipótesis de que las medias de los renglones son iguales puede rechazarse al nivel de signifi¬ 
cancia 0.05. AI nivel 0.05 existe diferencia en la fertilidad del suelo entre un renglón y otro. 

Como el valor F para las columnas es menor a 1, se concluye que en las columnas no hay diferencia en la fer¬ 
tilidad del suelo. 

Como el valor F para los tratamientos es 47.9 > 4.76, se concluye que hay diferencia entre los fertilizantes. 

b ) Como F 9g 3 6 = 9.78, al nivel de significancia 0.01 se puede aceptar la hipótesis de que no hay diferencia en la ferti¬ 
lidad del suelo en los renglones (o en las columnas). Sin embargo, al nivel de significancia 0.01 se sigue concluyendo 
que hay diferencia entre los fertilizantes. 
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c) Primero se presenta la estructura que deben tener los datos en la hoja de cálculo de M INITAB. 


Row 

Rows 

Columns 

Treatment 

Yield 

1 

1 

1 

1 

18 

2 

1 

2 

3 

21 

3 

1 

3 

4 

25 

4 

1 

4 

2 

11 

5 

2 

1 

4 

22 

6 

2 

2 

2 

12 

7 

2 

3 

1 

15 

8 

2 

4 

3 

19 

9 

3 

1 

2 

15 

10 

3 

2 

1 

20 

11 

3 

3 

3 

23 

12 

3 

4 

4 

24 

13 

4 

1 

3 

22 

14 

4 

2 

4 

21 

15 

4 

3 

2 

10 

16 

4 

4 

1 

17 


Obsérvese que los renglones y las columnas se han numerado del 1 al 4. Los fértil Izantes A aD de la tabla 16.24 han 
sido codificados en la hoja de cálculo 1 al 4, respectivamente. Con la secuencia de M IN ITAB Stat-> ANOVA -» General 
Linear M odel se obtiene el resultado siguiente. 


Modelo lineal general: rendimiento versus filas, columnas, tratamiento 


Factor 

Type 

Levels 


Valúes 


Rows 

f ixed 

4 

1 , 

2, 3, 4 


Columns 

f ixed 

4 

1 , 

2, 3, 4 


Treatment 

f ixed 

4 

1 , 

2, 3, 4 


Analysis of Variance for 

Yield, using Adjusted SS for Tests 

Source 

DF Seq SS 

Adj SS 


Adj MS F 

P 

Rows 

3 29.188 

29.188 


9.729 4.92 

0.047 

Columns 

3 4.688 

4.687 


1.562 0.79 

0.542 

Treatment 

3 284.188 

284.188 


94.729 47.86 

0.000 

Error 

6 11.875 

11.875 


1.979 


Total 

15 329.938 






S = l.40683 R-Sq= 96.40% R-sq(adj)-91.00% 


Los resultados de M INITAB coinciden con los antes obtenidos a mano. Estos resultados indican que hay dife¬ 
rencia en la fertilidad de un renglón a otro, al nivel de significancia 0.05, pero no al nivel 0.01. No hay diferencia en 
la fertilidad de una columna a otra. Hay diferencia entre los cuatro fertilizantes al nivel de significancia 0.01. 


d) Con la secuencia Statistics —> Linear Models-» Analysisof Variance-» Latín Square Design de STATISTIX se 

obtiene el resultado siguiente. 

Statistix 8.0 


Latin Square AOV Table for Yield 

Source DF 


Rows 3 
Columns 3 
Treatment 3 
Error 6 
Total 15 


SS MS 

29.188 9.7292 

4.688 1.5625 

284.188 94.7292 

11.875 1.9792 

329.938 


F 


P 


47.86 


0.0001 
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CUADRADOS GRECOLATINOS 

16.16 Se quiere determinar si hay una diferencia significativa entre las gasolinas/!, B, C y D en su rendimiento por 
galón. Diseñar un experimento en el que se usen cuatro conductores distintos, cuatro automóviles distintos y 
cuatro carreteras distintas. 

SOLUCIÓN 

Como el número de gasolinas, de conductores, de automóviles y de carreteras es el mismo (cuatro), puede emplearse un 
cuadrado grecolatino. Supóngase que los diferentes automóviles están representados por los renglones y los diferentes 
conductores por las columnas, como se muestra en la tabla 16.28. Después, las gasolinas (A, B, C y D) se asignan en forma 
aleatoria a los renglones y a las columnas, sujetas a la condición de que cada letra aparezca sólo una vez en cada renglón y 
una vez en cada columna. Por lo tanto, cada conductor tendrá la oportunidad de conducir cada uno de los automóviles y 
usar cada uno de los tipos de gasolina, y ningún automóvil será conducido dos veces con el mismo tipo de gasolina. 

A hora se asignan en forma aleatoria las cuatro carreteras, denotadas a, / 3 , 7 y 5 , sujetándolas a la misma condición 
impuesta a los cuadrados latinos. Por lo tanto, cada conductor tendrá también la oportunidad de conducir por cada una de 
las carreteras. En la tabla 16.28 se muestra una posible distribución. 


Tabla 16.28 



Conductor 


1 

2 

3 

4 

Automóvil 1 

6 7 

A P 

D s 


Automóvil 2 

^<5 

Ba 

C 7 

D 0 

Automóvil 3 

Da 

Cs 

h 


Automóvil 4 



A a 

Bs 


16.17 Supóngase que al llevara cabo el experimento del problema 16.16, las millas por galón son las indicadas en la 
tabla 16.29. Utilizar el análisis de varianza para determinar si al nivel de significancia 0.05 hay diferencias. 
U sar M INITA B para obtener la tabla del análisis de varianza y usar los valores p dados por M INITA B para 
probar si existen diferencias al nivel de significancia 0.05. 


Tabla 16.29 



Conductor 


1 

2 

3 

4 

Automóvil 1 

B 7 19 

LO 

1 —1 

D 5 16 

C q 14 

Automóvil 2 

A¿ 15 

fio 18 

C 7 11 

D 0 15 

Automóvil 3 

D a 14 

c,n 

fip 21 

LO 

1 —1 

<- 

Automóvil 4 

LO 

1 —1 

O 

LO 

1 —1 

c“~ 

Q 

A a 15 

fi <5 23 
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SOLUCION 


Primero se obtienen los totales de los renglones y de las columnas, como se muestra en la tabla 16.30. Después se obtienen 
los totales correspondientes a cada letra latina y a cada letra griega como se indica a continuación: 


Total A 

15 + 16+15+16 

= 62 

Total 6 : 

19 + 18 + 21+23 

= 81 

Total C: 

16 + 11 + 11 + 14 

= 52 

Total D: 

14 + 16+16+15 

= 61 

Total a: 

14 + 18 + 15+14 

= 61 

Total (3: 

16 + 16 + 21 + 15 

= 68 

Total 7 : 

19 + 16+11 + 16 

= 62 

Total 8: 

15 + 11 + 16 + 23 

= 65 


A hora, se calculan las variaciones correspondientes, usando el método abreviado: 

(256) 2 


Renglones: 


Columnas: 


(65) 2 | (59 ) 2 | (62) 2 | (70) 2 


Gasolinas (A, B,C, D): 

Carreteras (a, /3, 7 , 6): 

La variación total es 


(64j (61) 2 (63)- ( 68) 2 

4 ' 4 ' 4 ' 4 

(62) 2 | (81) 2 | (52) 2 | (61) 2 


(61) 2 ( 68 j (62) 2 (65) 2 

4 ' 4 ' 4 ' 4 


16 


(256T 

16 

(256 f 
16 

(256 f 
16 


= 4 112.50 - 4 096 = 16.50 


= 4 102.50 - 4 096 = 6.50 


= 4 207.50 -4 096= 111.50 


= 4 103.50 - 4 096 = 7.50 


( 19) 2 + ( 16) 2 + ( 16) 2 + • • ■ + ( 15) 2 + (23) 2 - (256) 

de manera que la variación debida al error es 

148.00 - 16.50 - 6.50 - 111.50 - 7.50 = 6.00 

Los resultados se muestran en la tabla 16.31, la tabla del análisis de varianza. El número total de grados de libertad 
es N 2 - 1, ya que se trata de un cuadrado de N x N. Cada uno de los renglones, de las columnas, de las letras latinas y de 
las letras griegas tiene N - 1 grados de libertad. Por lo tanto, los grados de libertad para el error son N 2 - 1 - 4(N - 1) 
= [N - 1 )(N - 3). E n este caso, N =4. 


16 


= 4 244 - 4 096 = 148.00 


Tabla 16.30 






Total 


B 7 19 

A l3 16 

16 

Cq 14 

65 


A ¿ 15 

B a 18 

C 7 11 

0,15 

59 


D a 14 

C á ll 

Bp 21 

LO 

1 — 1 

c- 

62 


C 0 16 

LO 

1 — 1 

?— 

Q 

A a 15 

B s 23 

70 

Total 

64 

61 

63 

68 

256 
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Tabla 16.31 


Variación 

Grados de 
libertad 

Cuadrado medio 

F 

Renglones (automóviles), 
16.50 

3 

5.500 

5.500 „ 

-= 2.75 

2.000 

Columnas (conductores), 
6.50 

3 

2.167 


Gasolinas (A, B,C y D), 
111.50 

3 

37.167 


Carreteras (a, (3, 7 y S), 

7.50 

3 

2.500 

iSS-** 

Error, 

6.00 

3 

2.000 


Total, 

148.00 

15 




Se tiene queF g53i3 = 9.28 y F g g i3 3 = 29.5. Por lo tanto, la hipótesis de que las gasolinas son ¡guales puede recha¬ 
zarse al nivel 0.05, pero no al nivel 0.01. 

Primero se presenta la estructura que deben tener los datos en la hoja de cálculo de M INITAB. 


Row 

1 

2 

3 

4 

5 

6 

7 

8 
9 

10 

11 

12 

13 

14 

15 

16 


Car 

1 

1 

1 

1 

2 

2 

2 

2 

3 

3 

3 

3 

4 
4 
4 
4 


Driver 
1 
2 

3 

4 
1 
2 

3 

4 
1 
2 

3 

4 
1 
2 

3 

4 


Gasoline 

2 

1 

4 

3 

1 

2 

3 

4 
4 
3 
2 
1 

3 

4 
1 
2 


Road 

3 
2 

4 
1 
4 
1 

3 
2 
1 

4 
2 
3 
2 

3 
1 

4 


MPG 

19 

16 

16 

14 

15 
18 
11 

15 

14 
11 
21 

16 
16 
16 

15 
23 


Obsérvese que los automóviles y los conductores están numerados en la hoja de cálculo de M IN ITA B Igual que en 
la tabla 16.29. Las gasolinas en la tabla 16.29 van de la A a la D, y en la hoja de cálculo de M IN ITAB se han codificado del 
1 al 4, respectivamente. Las carreteras son a, f3, 7 y S en la tabla 16.29, en la hoja de cálculo de M IN ITAB se han codifi¬ 
cado 1, 2, 3 y 4. Con la secuencia Stat — > ANOVA -» General Linear Model de M IN ITA B se obtienen los resultados 
siguientes. 


Modelo lineal general: millas por galón versus automóvil, conductor, gasolina, carretera 


Factor 

Type 

Levels 


Valúes 

Car 

f ixed 

4 

1, 

2, 3, 4 

Driver 

f ixed 

4 

1, 

2, 3, 4 

Gasoline 

f ixed 

4 

1, 

2, 3, 4 

Road 

f ixed 

4 

1, 

2, 3, 4 
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Analysis of Variance for Mpg, using Adjusted SS for Tests 


Source 

DF 

Seq SS 

Adj SS 

Adj MS 

F 

P 

Car 

3 

16.500 

16.500 

5.500 

2.75 

0.214 

Driver 

3 

6.500 

6.500 

2.167 

1.08 

0.475 

Gasoline 

3 

111.500 

111.500 

37.167 

18.58 

0.019 

Road 

3 

7.500 

7.500 

2.500 

1.25 

0.429 

Error 

3 

6.000 

6.000 

2.000 



Total 

15 

148.000 






La columna titulada Se q MS en los resultados de M INITAB corresponde a la columna titulada Mean S q u a r e 
en latabla 16.31. LosvaloresF cal cul ados en los resultados deM INITAB son los mismos quelosdelatablal6.31. 
Los valoresp para automóviles, conductores, marcas de gasolina y carreteras son 0.214, 0.475, 0.019 y 0.429, respec¬ 
tivamente. Recuérdese que un valor p es el mínimo valor para un nivel de significancia preestablecido al que puede 
rechazársela hipótesis de medias ¡guales de un factor. Los valores p Indican que no hay diferencia entre los automó¬ 
viles, conductores o carreteras a los niveles 0.01 o 0.05. Las medias de las marcas de gasolina son estadísticamente 
diferentes al nivel 0.05, pero no al nivel 0.01. Posteriores Investigaciones sobre las medias de las marcas de gasolina 
pueden Indicar cómo éstas difieren. 


PROBLEMAS DIVERSOS 

16.18 Probar [ecuación (15) de este capítulo] que a ¡ = 0. 

SOLUCIÓN 

Las medias de la población de los tratamientos y la media de la población total y se relacionan mediante 

A = (53) 

j 

Entonces, como a¡ = y¡ = y, empleando la ecuación (53) se tiene, 

Y^ a j = Yl (A/ - ¡A = A/ - «A = 0 ( 54 ) 

i j i 

16.19 Deducir: a) la ecuación (16) y b) la ecuación (17) de este capítulo. 

SOLUCIÓN 

a) Por definición, se tiene 



donde S 2 es la varianza muestral correspondiente al tratamiento j. Entonces, como el tamaño de la muestra es b, 

E( Vw) = E(S}) = b ¿ ( h -j± a 2 ) = a{b - l)a 2 

J= 1 .7=1 V ' 

b ) Por definición 

a a a a 

Vg = bJ2 (Xj. - -T) 2 = h Xj. - 2I, X X j- + abx2 = h J2 X f ~ abx2 

i i / i / i j =i 

ya que X = (V.jsñ)/a. Entonces, omitiendo el índice de sumación se tiene 

E(V B ) = bJ2 E (xf.)~abE(X 2 ) 


(55) 
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Ahora para cualquier variable aleatoria U, E(U 2 ) = var(ll) + [E (L/)] 2 , donde var(L/) denota la varianza deU. Por lo 

tanto, 


l-(Xj) - var (Xj) | J-(Xjy 2 (56) 

E(X 2 ) = vav(X) + [E{X)f (57) 

Pero como las poblaciones de los tratamientos son normales, con media y¡m y + a¡, se tiene 

var = j (58) 


var (X) = 


ab 


E ( x i .) = M + a.j 

E(X) = y 

Usando las ecuaciones (56) a (61) junto con la ecuación (55), se tiene 


E{V B ) = bY J 


(7 , , i 

— + (/i + CXj) 


-ab 


a , 2 


= aa 2 + b ^ (y + aj) 2 — cr — aby 2 
= (a — 1 jcr 2 + aby 2 + 2 by Yj a¡ + b Yj aj + aby 1 
= (a — 1 )a 2 + b ^ aj 


(59) 

(60) 
(61) 


16.20 Probar el teorema 1 de este capítulo. 

SOLUCIÓN 

Como se muestra en el problema 16.19, 

a v a h v 2 

V w = bYsj o bien Kk = Y / Y 

U a U a 

donde S 2 es la varianza muestral de muestras de tamaño b obtenidas de la población del tratamiento j. Se ve que bS 2 /a 2 
tiene una distribución ji cuadrada con b - 1 grados de libertad. Por lo tanto, como las varianzasS^ 2 son independientes, se 
concluye, de acuerdo con la página 299, que V w /a 2 tiene una distribución ji cuadrada con a(Jb - 1) grados de libertad. 
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PROBLEMAS SUPLEMENTARIOS 

CLASIFICACIÓN EN UN SENTIDO O EXPERIMENTOS CON UN FACTOR 

Se aconseja al lector que todos estos ejercicios los haga primero "a mano”, empleando las ecuaciones dadas en este 
capítulo, antes de usar el software sugerido. Esto le ayudará a comprender mejor la técnica A NOVA, así como a apre¬ 
ciar la potencia del software. 

16.21 Se realiza un experimento para determinar el rendimiento de cinco tipos diferentes de trigo: A, B, C, D y E. A cada variedad 
se le asignan cuatro parcelas; los rendimientos (en bushels por acre) se muestran en la tabla 16.32. Suponiendo que las 
parcelas tengan una fertilidad semejante y que las variedades de trigo se asignen a las parcelas en forma aleatoria, a los 
niveles de significancia a) 0.05 y b) 0.01, determinar si hay diferencia entre los rendimientos, c) Proporcionar el análisis 
que se obtiene para esta clasificación en un sentido o experimento de un factor empleando M INITA B. 


Tabla 16.32 


A 

20 

12 

15 

19 

B 

17 

14 

12 

15 

C 

23 

16 

18 

14 

D 

15 

17 

20 

12 

E 

21 

14 

17 

18 


16.22 U na empresa quiere probar cuatro tipos de neumáticos: A, B, C y D. En la tabla 16.33 seda (en miles de millas) la duración 
de estos neumáticos, determinada por el dibujo, donde cada tipo de neumático ha sido probado en seis automóviles simila¬ 
res asignados, a los neumáticos, en forma aleatoria. A los niveles de significancia: a) 0.05 y b ) 0.01, determinar si hay 
alguna diferencia significativa entre los neumáticos, c) Proporcionar el análisis que se obtiene para esta clasificación en un 
sentido o experimento de un factor empleando STATISTIX. 


Tabla 16.33 


A 

33 

38 

36 

40 

31 

35 

B 

32 

40 

42 

38 

30 

34 

C 

31 

37 

35 

33 

34 

30 

D 

29 

34 

32 

30 

33 

31 


16.23 U n maestro quiere probar tres métodos de enseñanza: I, II y III. Para esto se eligen en forma aleatoria tres grupos, cada uno 
de cinco estudiantes y con cada grupo se emplea uno de estos tres métodos de enseñanza. A todos los estudiantes se les 
aplica un mismo examen. En la tabla 16.34 se presentan las calificaciones que obtuvieron. A los niveles de significancia: 
a) 0.05 y b ) 0.01, determinar si hay diferencia entre estos tres métodos de enseñanza, c) Proporcionar el análisis que se 
obtiene empleando EXCEL para esta clasificación en un sentido o experimento de un factor. 


Tabla 16.34 


M étodo 1 

75 

62 

71 

58 

73 

M étodo 11 

81 

85 

68 

92 

90 

M étodo III 

73 

79 

60 

75 

81 
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MODIFICACIONES PARA NÚMEROS DISTINTOS DE OBSERVACIONES 

16.24 En la tabla 16.35 sedan las cifras en millas por galón obtenidas en automóviles similares usando cinco marcas de gasolina. 
A los niveles de significancia: a) 0.05 y b ) 0.01, determinar si hay diferencia entre las marcas, c) Proporcionar el análisis 
que se obtiene para esta clasificación en un sentido o experimento de un factor empleando SPSS. 


Tabla 16.35 


M arca A 

12 

15 

14 

11 

15 

M arca B 

14 

12 

15 



M arca C 

11 

12 

10 

14 


M arca D 

15 

18 

16 

17 

14 

M arca E 

10 

12 

14 

12 



Tabla 16.36 


M atemáticas 

72 

80 

83 

75 

Ciencias 

81 

74 

77 


Inglés 

88 

82 

90 

87 80 

Economía 

74 

71 

77 

70 


16.25 En la tabla 16.36 se presentan las calificaciones obtenidas durante un semestre por un estudiante. A los niveles de signifi¬ 
cancia: a) 0.05 y b ) 0.01, determinar si hay diferencia significativa entre las calificaciones de este estudiante, c) Proporcionar 
el análisis que se obtiene para esta clasificación en un sentido o experimento de un factor empleando SAS. 


CLASIFICACIÓN EN DOSSENTIDOSO EXPERIMENTOS CON DOS FACTORES 

16.26 Los artículos que produce una empresa son fabricados por tres operadores que usan tres máquinas diferentes. La empresa 
desea determinar si hay diferencia: a) entre los operadores y b) entre las máquinas. Se realiza un experimento para deter¬ 
minar la cantidad de artículos por día producidos por cada operador usando cada máquina; en la tabla 16.37 se muestran 
los resultados. Empleando M INITAB al nivel de significancia 0.05, proporcionar la Información buscada. 


Tabla 16.37 



Operador 

1 

2 

3 

M áquina A 

23 

27 

24 

M áqulna B 

34 

30 

28 

M áqulna C 

28 

25 

27 


Tabla 16.38 



Tipo de trigo 

1 

II 

III 

IV 

BloqueA 

12 

15 

10 

14 

Bloques 

15 

19 

12 

11 

BloqueC 

14 

18 

15 

12 

BloqueD 

11 

16 

12 

16 

BloqueE 

16 

17 

11 

14 


16.27 Resolver el problema 16.26 usando EXCEL y el nivel de significancia 0.01. 

16.28 Se plantan semillas de cuatro tipos diferentes de trigo en cinco bloques. Cada bloque se divide en cuatro parcelas que des¬ 
pués se asignan en forma aleatoria a los cuatro tipos de trigo. Al nivel de significancia 0.05, determinar si los rendimientos, 
en bushels por acre, que se presentan en la tabla 16.38, varían en forma significativa con respecto a: a) el suelo (es decir, a 
los cinco bloques) y b) el tipo de trigo. Usar SPSS para construir una tabla deANOVA. 

16.29 Resolver el problema 16.28 usando STATISTIX y el nivel de significancia 0.01 para construir A NOVA. 

16.30 Supóngase que en el problema 16.22 la primera observación con cada tipo de neumático se haga usando determinado tipo 
de automóvil, la segunda observación se haga usando un segundo tipo de automóvil, y así sucesivamente. Determinar al 
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nivel de significancia 0.05 si hay diferencia: a) entre los tipos de neumáticos y ib) entre los tipos de automóviles. Usar SAS 
para construir la tabla deANOVA. 

16.31 Resolver el problema 16.30 usando M INITAB y el nivel de significancia 0.01. 

16.32 Supóngase que en el problema 16.23 la primera entrada para cada método de enseñanza corresponde a un estudiante de 
determinada escuela, la segunda a un estudiante de otra escuela, y así sucesivamente. Probar la hipótesis de que al nivel de 
significancia 0.05 hay diferencia: a) entre los métodos de enseñanza y b ) entre las escuelas. Para construir una tabla de 
ANOVA usarSTATISTIX. 

16.33 Se realiza un experimento para probar si el color de pelo y la estatura de las estudiantes de Estados U nidos tiene alguna 
relación con los logros escolares. En la tabla 16.39 se presentan los resultados, donde los números indican la cantidad de 
personas en el 10% superior de esta evaluación. Analizar el experimento al nivel de significancia 0.05. Para construir una 
tabla deANOVA utiIizar EXCEL. 


Tabla 16.39 



Pelirroja 

Rubia 

Castaña 

Alta 

75 

78 

80 

M ediana 

81 

76 

79 

Baja 

73 

75 

77 


Tabla 16.40 


A 

16 

18 

20 

23 

B 

15 

17 

16 

19 

C 

21 

19 

18 

21 

D 

18 

22 

21 

23 

E 

17 

18 

24 

20 


16.34 Resolver el problema 16.33 al nivel de significancia 0.01. Usar SPSS para obtener la tabla deANOVA y comparar los 
resultados con los de EXCEL dados en el problema 16.33. 


EXPERIMENTOS CON DOS FACTORES CON REPLICACIÓN 

16.35 Supóngase que el experimento del problema 16.21 se llevó a cabo en el sur y que las columnas de la tabla 16.32 indican 
ahora cuatro tipos de fertilizantes, y que un experimento similar se lleva a cabo en el oeste dando los resultados que se 
muestran en la tabla 16.40. AI nivel de significancia 0.05, determinar si hay diferencia en los rendimientos que se deban a: 
a) los fertilizantes y b) el lugar. Usar M IN ITAB para elaborar la tabla deANOVA. 

16.36 Resolver el problema 16.35 al nivel de significancia 0.01. Para elaborar la tabla deANOVA emplear STATISTIX y com¬ 
parar los resultados con los dados por M INITA B en el problema 16.35. 

16.37 En la tabla 16.41 sedan las cantidades de artículos producidos, en cada uno de los días de la semana, por cuatro operadores 
que trabajan con dos tipos de máquinas, I y II. Al nivel de significancia 0.05, determinar si hay diferencias significativas: 
a) entre los operadores y b) entre las máquinas. Construir una tabla deANOVA usando SAS y otra usando M IN ITA B. 


Tabla 16.41 



M áquina 1 

M áquina II 

Lunes 

M artes 

M iércoles 

J ueves 

Viernes 

Lunes 

M artes 

M iércoles 

J ueves 

Viernes 

Operador A 

15 

18 

17 

20 

12 

14 

16 

18 

17 

15 

Operador B 

12 

16 

14 

18 

11 

11 

15 

12 

16 

12 

Operador C 

14 

17 

18 

16 

13 

12 

14 

16 

14 

11 

Operador D 

19 

16 

21 

23 

18 

17 

15 

18 

20 

17 
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CUADRADOS LATINOS 

16.38 Se realiza un experimento para probar los efectos sobre la producción de trigo de cuatro fertilizantes (A,B,C y D) y de las 
variaciones en el suelo en dos direcciones perpendiculares. Se obtiene el cuadrado latino de la tabla 16.42, donde los núme¬ 
ros corresponden a la producción de trigo por unidad de área. AI nivel de significancia 0.01, probar la hipótesis de que no 
hay diferencia entre; a) los fertilizantes y b ) las variaciones en el suelo. Usar STATISTIX para elaborar la tabla de 
A NOVA. 


Tabla 16.42 


C 8 

A 10 

D 12 

B 11 

A 14 

C 12 

B 11 

D 15 

D 10 

B 14 

C 16 

A 10 

B 7 

D 16 

A 14 

C 12 


Tabla 16.43 


E 75 

1/1/ 78 

M 80 

M 81 

E 76 

1/1/ 79 

1/1/ 73 

M 75 

E 77 


16.39 Resolver el problema 16.38 al nivel de significancia 0.05. Para construir la tabla A NOVA utilizar M INITAB y comparar 
los resultados con los de STATISTIX del problema 16.38. 

16.40 Volviendo al problema 16.33, suponer que se Introduce un factor más, dado por el área E, Mol/1/ de Estados U nidos en la 
que nació la estudiante, como se muestran en la tabla 16.43. Al nivel de significancia 0.05, determinar si hay diferencia 
significativa en los logros académicos de las estudiantes debido a: a) la estatura, b) el color de pelo y c) el lugar de naci¬ 
miento. U sar SPSS para elaborar la tabla de A N OVA. 


CUADRADOSGRECOLATINOS 

16.41 Con objeto de producir un tipo mejor de alimento para gallinas, a los ingredientes básicos se les agregan cuatro cantidades 
distintas de cada una de dos sustancias químicas. L as diferentes cantidades déla primera sustancia química se indican como 
A,B,C y D, en tanto que las cantidades de la segunda sustancia química se indican como a, ¡3,y y 5. El alimento es sumi¬ 
nistrado a pollitos recién nacidos agrupados de acuerdo con cuatro pesos Iniciales (l/l/j, 1/1/ 2 ,1/1/ 3 y l/l/ 4 ) y a cuatro especies 
diferentes (S lf S 2 , S 3 y S 4 ). En el cuadro grecolatino de la tabla 16.44 se da el aumento de peso por unidad de tiempo. Efectuar 
un análisis de varianza de este experimento al nivel de significancia 0.05 y brindar las conclusiones que se obtengan. Para 
elaborar la tabla de A NOVA, usar M INITAB. 


Tabla 16.44 



l/l/j 

W 2 

14/3 

1/1/ 4 

Sr 

C 7 8 

Bp 6 

A a 5 

D s 6 

s 2 

A s 4 

Do 3 

Cp 7 

fi 7 3 

S 3 

D i3 5 

*7 6 

Bs 5 

C q 6 

s 4 

B a 6 

C á 10 

d 7 10 

V 


16.42 


Cada una de cuatro empresas (C lf C 2 , C 3 y C 4 ) fabrica cuatro tipos distintos de cable (T lf T 2 , T 3 y T 4 ). Cuatro operadores 
(A, B, C y D) emplean cuatro máquinas diferentes (a, ¡3, y y 5) para medir la resistencia de los cables. Las resistencias 
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promedio encontradas se presentan en el cuadro grecolatino de la tabla 16.45. AI nivel de significancia 0.05, hacer un 
análisis de varianza y proporcionar las conclusiones. Usar SPSS para elaborar la tabla deANOVA. 


PROBLEMAS DIVERSOS 

16.43 En la tabla 16.46 se dan los datos del óxido acumulado sobre hierro tratado con las sustancias químicasA, 6 y C, respecti¬ 
vamente. A los niveles de significancia: a) 0.05 y b ) 0.01, determinar si hay diferencia significativa entre los tratamientos. 
Usar EXCEL para elaborar la tabla deANOVA. 


Tabla 16.45 



C 1 

c 2 

c 3 

C 4 

Ti 

A 0 164 

B 7 181 

C.193 

D s 160 

T 2 

Cí 171 

D a 162 

A 7 183 

6 / 3 145 

T 3 

D 7 198 

Cp 212 

6,-207 

A a 188 

T, 

fi a 157 

A s 172 

166 

C 7 136 


Tabla 16.46 


A 

3 

5 

4 

4 

B 

4 

2 

3 

3 

C 

6 

4 

5 

5 


16.44 En un experimento se mide el coeficiente intelectual (Cl) de estudiantes adultos de estaturas baja, media y alta. En la tabla 
16.47 se dan los resultados. A los niveles de significancia: a) 0.05 y b) 0.01, determinar si hay diferencia en los Cl de 
acuerdo con las distintas estaturas. Usar M INITAB para elaborar la tabla deANOVA. 


Tabla 16.47 


Alta 

110 

105 

118 

112 

90 

Baja 

95 

103 

115 

107 


M edia 

108 

112 

93 

104 

96 102 


16.45 Probar las ecuaciones (10), (11) y (12) de este capítulo. 

16.46 Se hace un examen para determinar, entre veteranos y no veteranos con diferente Cl, quiénes tienen mejor desempeño. Las 
puntuaciones obtenidas se muestran en la tabla 16.48. Al nivel de significancia 0.05, determinar si hay diferencias en las 
puntuaciones debidas a diferencias en: a) ser o no veterano y b) el Cl. Usar SPSS para elaborar una tabla de A NOVA. 


Tabla 16.48 



Puntuación en la prueba 


Cl 

Cl 

Cl 


alto 

medio 

bajo 

Veterano 

90 

81 

74 

N 0 veterano 

85 

78 

70 
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16.47 Usar STATISTIX para resolver el problema 16.46 al nivel de significancia 0.01. 

16.48 En la tabla 16.49 se presentan las puntuaciones que obtuvieron en un examen estudiantes de distintas partes de un país y 
con diferente Cl. Analizar esta tabla al nivel de significancia 0.05 y dar las conclusiones. Usar M INITAB para elaborar la 
tabla de A NOVA. 

16.49 U sar SA S para resolver el problema 16.48 al nivel de significancia 0.01. 

16.50 En el problema 16.37, ¿se puede determinar si hay diferencia significativa en la cantidad de artículos producidos en los 
distintos días de la semana? Explicar. 


Tabla 16.49 



Puntuación en el examen 


Cl 

Cl 

Cl 


alto 

medio 

bajo 

Este 

88 

80 

72 

Oeste 

84 

78 

75 

Sur 

86 

82 

70 

Norte y centro 

80 

75 

79 


16.51 Se sabe que en los cálculos del análisis de varianza a cada entrada se le puede sumar o restar una constante adecuada sin 
que esto afecte las conclusiones. ¿Pasa lo mismo si cada entrada se multiplica o se divide entre una constante adecuada? 
Justificar la respuesta. 


16.52 Deducir las ecuaciones (24), (25) y (26) para cantidades desiguales de observaciones. 

16.53 Suponer que los resultados en la tabla 16.46 del problema 16.43 corresponden al noreste de Estados U nidos y que para el 
oeste, los resultados correspondientes son los dados en la tabla 16.50. Al nivel de significancia 0.05, determinar si hay 
diferencias que se deban a: a) la sustancias químicas y b) la ubicación. Usar M IN ITAB para elaborar la tabla de A NOVA. 


Tabla 16.50 


A 

5 

4 

6 

3 

B 

3 

4 

2 

3 

C 

5 

7 

4 

6 


Tabla 16.51 


A 

17 

14 

18 

12 

B 

20 

10 

20 

15 

C 

18 

15 

16 

17 

D 

12 

11 

14 

11 

E 

15 

12 

19 

14 


15.54 Volviendo a los problemas 16.21 y 16.35, suponer que se lleva a cabo otro experimento en el noreste y se obtienen los 
resultados dados en la tabla 16.51. Al nivel de significancia 0.05, determinar si hay diferencias entre los rendimientos 
debidas a: a) los fértil Izantes y b ) las tres ubicaciones. Emplear STATISTIX para elaborar la tabla deANOVA. 
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16.55 Resolver el problema 16.54 al nivel de significancia 0.01. Usar M INITAB para elaborar la tabla deAN OVA. 

16.56 Al nivel de significancia 0.05, hacer un análisis de varianza del cuadrado latino de la tabla 16.52 y proporcionar las con¬ 
clusiones. Usar SPSS para construir la tabla deAN OVA. 


Tabla 16.52 


Factor 1 


B 16 

C 21 

A 15 

A 18 

B 23 

C 14 

C 15 

A 18 

B 12 


16.57 Estructurar un experimento que lleve al cuadrado latino de la tabla 16.52. 

16.58 Al nivel de significancia 0.05, realizar el análisis de varianza del cuadrado grecolatlno de la tabla 16.53 y proporcionar las 
conclusiones. Usar SPSS para elaborar la tabla deAN OVA. 


Tabla 16.53 

Factor 1 


4 7 6 

B 0 12 

C, 4 

D a 18 

B s 3 

8 

D 7 15 

C/3 14 

D 0 15 

C 7 20 

B a 9 

5 

C a 16 

D s 6 

V 7 

7 


16.59 Diseñar un experimento que conduzca al cuadrado grecolatino de la tabla 16.53. 

16.60 Describir cómo usar el análisis de varianza en un experimento de tres factores con replicaciones. 

16.61 Diseñar y resolver un problema que ilustre el procedimiento del problema 16.60. 

16.62 Probar: a) la ecuación (30) y b) las ecuaciones (31) a (34) de este capítulo. 

16.63 En la práctica, ¿se esperaría hallar: a) un cuadrado latino 2 x 2 y b) un cuadrado grecolatino de 3 x 3? Explicar. 














Pruebas 

NO PARAM ÉTRICAS 



INTRODUCCIÓN 

La mayor parte de las pruebas de hipótesis y significancia (o reglas de decisión), vistas en los capítulos anteriores, 
requieren varias suposiciones acerca de la población de la que se toma la muestra. Por ejemplo, en la clasificación en 
un sentido del capítulo 16 se requiere que las poblaciones tengan una distribución normal y desviaciones estándar 
iguales. 

En la práctica, hay situaciones en las que tales suposiciones no se justifican o en las que se duda que se satisfagan, 
como es el caso de poblaciones muy sesgadas. Debido a esto, se han desarrollado diversas pruebas y métodos que son 
independientes tanto déla distribución délas poblaciones como de sus correspondientes parámetros. Estas pruebas se 
conocen como pruebas no paramétricas. 

Las pruebas no paramétricas se emplean como sustitutos sencillos de pruebas más complicadas; son especialmen¬ 
te útiles cuando se tienen datos no numéricos, como en el caso de consumidores que ordenan cereales u otros produc¬ 
tos, de acuerdo con su preferencia. 

LA PRUEBA DE LOSSIGNOS 

Considérese la tabla 17.1 en la que se muestran las cantidades de tornillos defectuosos producidos en 12 días conse¬ 
cutivos con dos máquinas (I y li); se supone que las dos máquinas tienen la misma producción total diaria. Se desea 
probar la hipótesis H 0 de que no hay diferencia entre las máquinas: que las diferencias observadas entre las máquinas, 
en términos de cantidades de tornillos defectuosos producidos, son resultado de la casualidad, lo que equivale a decir 
que las muestras provienen de la misma población. 


Tabla 17.1 


Día 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

M áquina 1 

47 

56 

54 

49 

36 

48 

51 

38 

61 

49 

56 

52 

M áquina II 

71 

63 

45 

64 

50 

55 

42 

46 

53 

57 

75 

60 


Una sencilla prueba no paramétrica para muestras por pares es la prueba de los signos. Esta prueba consiste en 
calcular las diferencias entre las cantidades de tornillos defectuosos producidos por día y anotar únicamente el signo 
de cada diferencia, por ejemplo, el día 1 la diferencia es 47-71, que es negativa. De esta manera, a partir de la tabla 
17.1 se obtiene la secuencia de signos siguiente. 

- + - + - ( 1 ) 
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(es decir, 3 signos más y 9 signos menos). Si es igualmente probable obtener un + que un se esperaría que se obtu¬ 
vieran 6 de cada uno. La prueba H 0 es, entonces, equivalente a preguntarse si una moneda está o no cargada, si en 12 
lanzamientos de la moneda se obtienen 3 caras (+) y 9 cruces (-). Esto implica la distribución binomial vista en el 
capítulo 7. En el problema 17.1 se muestra que empleando una prueba de dos colas con esta distribución, al nivel de 
significancia 0.05, no se puede rechazar H 0 ; es decir, a este nivel no hay diferencia entre las máquinas. 

Nota 1: Si algún día las máquinas producen la misma cantidad de tornillos defectuosos, una dife¬ 
rencia en la secuencia (1) será cero. En este caso, se eliminan esos valores muéstrales y se usan 11 
en vez de 12 observaciones. 

Nota 2: También puede usarse una aproximación normal a la distribución binomial empleando la 
corrección por continuidad (ver problema 17.2). 

Aunque la prueba de los signos es especialmente útil para muestras por pares, como la muestra de la tabla 17.1, 
también puede usarse para problemas con muestras sencillas (no pares) (ver los problemas 17.3 y 17.4). 

LA PRUEBA U DE MANN-WHITNEY 

Considérese la tabla 17.2, en la que se dan las resistencias de cables hechos de dos aleaciones distintas, I y II. En esta 
tabla se tienen dos muestras: 8 cables de la aleación I, y 10 cables de la aleación II. Se quiere decidir si hay diferencia 
entre las muestras o, lo que es lo mismo, si provienen o no de la misma población. Aunque este problema se puede 
resolver empleando la prueba t del capítulo 11, también puede utilizarse una prueba no paramétrica llamada la prueba 
U de M ann-Whitney. Esta prueba consta de los pasos siguientes: 


Tabla 17.2 


Aleación 1 

Aleación II 

18.3 

16.4 

22.7 

17.8 

12.6 

14.1 

20.5 

10.7 

15.9 

18.9 

25.3 

16.1 

24.2 

19.6 

12.9 

15.2 

11.8 

14.7 


Paso 1. Se combinan todos los valores muéstrales, se ordenan de menor a mayor, y a cada uno de los valores se 
le asigna una posición o rango (en este caso del 1 al 18). Si dos o más valores muéstrales son idénticos (es decir, si hay 
puntuaciones empatadas, o empates ), a cada uno de los valores muéstrales se les asigna una posición (o rango) igual 
a la media de las posiciones que les tocaría ocupar. Si en la tabla 17.2 la entrada 18.9 fuera 18.3, las posiciones 12 
y 13 estarían ocupadas por dos valores idénticos, de manera que la posición (o rango) asignada a cada uno sería 
1(12 + 13) = 12.5. 

Paso 2. Se obtiene la suma de los rangos de cada muestra. Estas sumas se denotan R 2 y R 2 , siendo N 2 y A/ 2 los 
respectivos tamaños muéstrales. Por conveniencia se elige como A/ 1 la muestra más pequeña, si éstas no son iguales, 
de manera que N 1 < A/ 2 . U na diferencia significativa entre las sumas de los rangos y R 2 implica una diferencia 
significativa entre las muestras. 

Paso 3. Para probar la diferencia entre las sumas de los rangos, se usa el estadístico 


U = N l N 2 + 


N^Ní + I) 


- R] 


( 2 ) 


que corresponde a la muestra 1. La distribución muestral de U es simétrica y tiene media y varianza dadas, respecti¬ 
vamente, por las fórmulas 


N l N 2 




n¡n 2 (n¡ + n 2 + 1) 

12 


Pu — 


2 


(3) 
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Si tanto N 1 como /V 2 son por lo menos igual a 8, entonces la distribución de U es aproximadamente normal, de 
manera que 


U ~ Mr/ 
a u 


(4) 


tiene una distribución normal con media 0 y desviación estándar 1. Empleando el apéndice II se puede, entonces, 
decidir si las muestras son o no significativamente diferentes. En el problema 17.5 se muestra que, al nivel de signifi¬ 
cancia 0.05, hay una diferencia significativa entre los cables. 

Nota 3: Un valor de U correspondiente a la muestra 2 es el dado por el estadístico 


U = N¡N 2 + 


n 2 (n 2 + 1 ) 


-R 2 


(5) 


y tiene la misma distribución muestral que el estadístico (2), siendo su media y su varianza las dadas 
por la fórmula (3). El estadístico (5) se relaciona con el estadístico (2), ya que si U 1 y U 2 son los 
valores correspondientes a los estadísticos (2) y (5), respectivamente, entonces se ti ene 


También se tiene 


Ui + U 2 = N { N 2 


( 6 ) 


T- Ri 


N{N+ 1 ) 
2 


(7) 


donde N =N 1 + N 2 - La fórmula (7) puede servir como verificación de los cálculos. 

Nota 4: En la ecuación (2), el estadístico U es el número de veces que los valores de la muestra 1 
preceden a los valores de la muestra 2, cuando todos los valores han sido ordenados en forma cre¬ 
ciente de magnitud. Esto proporciona un método alternativo de conteo para hallar U . 


LA PRUEBA H DE KRUSKAL-WALLIS 


La prueba U es una prueba no paramétrica para decidir si dos muestras provienen o no de una misma población. U na 
generalización de esta prueba para k muestras es la prueba H de Kruskal-Wallis o simplemente prueba H. 

Esta prueba se puede describir de la manera siguiente: supóngase que se tienen k muestras, cuyos tamaños son N v 
W 2 ,..., A/*, por lo que el tamaño de todas estas muestras juntas será N =N 1 + N 2 + ■ ■ ■ + N k . Supóngase además que 
todas estas muestras se juntan y sus valores se ordenan de menor a mayor asignándoles un rango, y que las sumas de 
los rangos, de cada una de las k muestras, son R v R 2 ,..., R k , respectivamente. Se define el estadístico como 


H = 


12 


Rl 


N(N+ 1 ) jr[ 


E¿- 3 í"+') 


( 8 ) 


se puede demostrar que la distribución muestral deH es aproximadamente una distribución chi cuadrada con k - 1 
grados de libertad, siempre que cada uno de los N v W 2 ,..., N k , sean por lo menos de 5. 

La prueba H proporciona un método no paramétrico de análisis de varianza para clasificaciones en un sentido o 
experimentos de un factor, pudiéndose hacer generalizaciones. 


PRUEBA H CORREGIDA PARA EMPATES 

Cuando hay demasiados empates entre las observaciones de los datos muéstrales, el valor deH dado por el estadístico 
(8) es menor délo que debiera ser. El valor correcto deH, que se denota H c , se obtiene dividiendo el valor dado por el 
estadístico (8) entre el factor de corrección 
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E (t 3 -t) 

N 3 -N 


(9) 


donde T es la cantidad de empates que corresponden a cada observación y donde la suma se toma sobre todas las 
observaciones. SI no hay empates, entonces T = 0 y el factor (9) se reduce a 1, de manera que no se necesita ninguna 
corrección. En la práctica, la corrección suele ser despreciable (es decir, no es suficiente para garantizar que haya un 
cambio de decisión). 


PRUEBA DE LAS RACHAS PARA ALEATORIEDAD 

A unque la palabra "aleatorio" se ha usado muchas veces en este libro, en ninguno de los capítulos anteriores se ha dado 
una prueba para aleatoriedad. La teoría de las rachas proporciona una prueba no paramétrica para aleatoriedad. 

Para entender qué es una racha, considérese una secuencia formada por dos símbolos, ay b, por ejemplo, 

a a\b b b \ a\b b \ a a a a a\b b b \ a a a a\ (10) 

Por ejemplo, en el lanzamiento de una moneda, a puede representar "cara" y b puede ser "cruz"; o al muestrear los 
tornillos producidos con una máquina, a puede corresponder a "defectuoso" y b a "no defectuoso". 

Una racha se define como un conjunto de símbolos Idénticos (o semejantes) que se encuentran entre dos símbolos 
diferentes o entre ningún símbolo (como el principio y el final de la secuencia). SI se lee la secuencia (10) de Izquier¬ 
da a derecha, la primera racha, cuyo fin está señalado por una línea vertical, consta de dos a; de manera similar, la 
segunda racha consta de tres b; la tercera racha consta de una a, etc. En total hay siete rachas. 

Parece claro que debe existir alguna relación entre aleatoriedad y cantidad de rachas. Así, en la secuencia 

a\b\a\b\a\b\a\b\a\b\a\b\ (11) 

se observa un patrón cíclico, en el que aparece una a y luego unab, otra vez una a y luego unab, etc., quesería difícil 
pensar que fuera aleatorio. En este caso, se tienen demasiadas rachas (en realidad, se ti ene la cantidad máxima posible, 
dada la cantidad de letras a y letras b). 

Por otro lado, en la secuencia 


a a a a a a\b b b b \ a a a a a\b b b \ 


( 12 ) 


parece haber un patrón de tendencia en el que se agrupan (o acumulan) las letras a y las letras b. En este caso hay muy 
pocas rachas y no se puede considerar que esta secuencia sea aleatoria. 

Por lo tanto, se considerará que una secuencia no es aleatoria si hay demasiadas o muy pocas rachas; si no es así, 
se considera que la secuencia es aleatoria. Para cuantificar esta ¡dea, supóngase que se forman todas las secuencias 
posibles que tengan una cantidad N 2 de letras a y una cantidad /V 2 deletrasb haciendo un total N de símbolos (o letras) 
(Nj + W 2 = N ). La colección de todas estas secuencias proporciona una distribución muestral: a cada secuencia le 
corresponde una cantidad de rachas, denotada I/. De esta manera se llega a la distribución muestral del estadístico 1 /. 
Puede demostrarse que esta distribución muestral tiene media y varianza dadas, respectivamente, por las fórmulas 


2 N x N 2 j 2 _2N { N 2 (2N X N 2 -N x - N 2 ) 
Ñi +N 2 ay ~ (ATj + 2V 2 ) 2 (7V 1 + n 2 - 1) 


(13) 


Empleando las fórmulas (13), se puede probar la hipótesis de aleatoriedad al nivel de significancia adecuado. Se encuen¬ 
tra que, si tanto N 1 como l\l 2 son por lo menos 8, entonces la distribución muestral del/ se aproxima a una distribución 
normal. Por lo tanto, 


V - Pv 

cr v 


( 14 ) 


tiene distribución normal, con media 0 y varianza 1, y por lo tanto puede emplearse el apéndice II. 
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OTRAS APLICACIONES DE LA PRUEBA DE LAS RACHAS 

Las siguientes son otras aplicaciones de las rachas para problemas estadísticos: 

1. Prueba mayor y menor que la mediana para aleatoriedad de datos numéricos. Para determinar si un conjunto 
de datos numéricos es aleatorio (por ejemplo, los datos de una muestra), primero se colocan los datos en el mismo 
orden en que se obtuvieron. Después, se encuentra la mediana de esos datos y cada dato se reemplaza por una a, si 
su valor es mayor que la mediana o por una b si su valor es menor que la mediana. SI un valor es igual a la media¬ 
na, se elimina de la muestra. La muestra es o no aleatoria según si la secuencia de letras a y b sea o no aleatoria. 
(Ver problema 17.20.) 

2. Diferencias entre poblaciones de las que se ha tomado una muestra. Supóngase que dos muestras de tamaños 
m y n se denotan a 1; a 2 ,..., a m y b v b 2 ,...,b n , respectivamente. Para decidir si las muestras provienen o no de una 
misma población, primero se ordenan todos Ios m + n valores muéstrales de menor a mayor. SI hay valores ¡guales, 
se deben ordenar mediante un proceso aleatorio (por ejemplo, empleando números aleatorios). Si la secuencia 
obtenida es aleatoria, se concluye que las muestras realmente no son diferentes y que, por lo tanto, provienen déla 
misma población; si la secuencia no es aleatoria, no puede sacarse tal conclusión. Esta prueba puede ser una alter¬ 
nativa a la prueba U de M ann-W hltney. (Ver problema 17.21.) 


CORRELACIÓN DE RANGOSDE SPEARMAN 


Los métodos no paramétricos también pueden usarse para medir la correlación entredós variables, X y Y. En lugar de 
emplear valores precisos de las variables, o cuando no se puede tener tal precisión, los datos se ordenan desde 1 hasta 
N de acuerdo con su tamaño, importancia, etc. Una vez que las variablesX y Y se han ordenado de esta manera, el 
coeficiente de corre/ación de rangos o fórmula de Spearman para correiación de rangos (como suele llamársele) es 


6 E D 2 


N{N 2 - 1 ) 


(15) 


donde D denota las diferencias entre los rangos de los valores correspondientes deX y Y y donde N es la cantidad de 
pares de valores (X, Y) que hay en los datos. 


PROBLEMAS RESUELTOS 


LA PRUEBA DE LOSSIGNOS 


17.1 Hágase referencia a la tabla 17.1 y al nivel de significancia 0.05, se prueba la hipótesis H 0 de que no hay dife¬ 
rencia entre las máquinas, contra la hipótesis alternativa Hj de que sí hay diferencia. 

SOLUCIÓN 

En la figura 17-1 se muestra la distribución binomlal deX caras en 12 lanzamientos de una moneda, en forma de áreas bajo 
los rectángulos, paraX = 0,1,..., 12. Sobrepuesta a la distribución binomlal se encuentra la distribución normal, trazada 
con una línea punteada. La media de la distribución blnomial es ¡x = Np = 12(0.5) = 6 . La desviación estándar es 
cr = s/Npq = v /12(0.5)(0.5) = V3 = 1 . 73 . La distribución normal también tiene media = 6 y desviación estándar = 1.73. 
De acuerdo con el capítulo 7, la probabilidad binomial deX caras es 



12 
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0.25 

0.20 

0.15 

0.10 

0.05 

0.00 

Figura 17-1 Distribución binomial (áreas bajo los rectángulos) y aproximación normal 
a la distribución binomial (curva punteada). 



Las probabilidades pueden encontrarse usando EXCEL. El valor p correspondiente al resultado X = 3 es 2P{X < 3}, 
que usando EXCEL es = 2* BI NOMDI ST( 3, 12, 0. 5, 1) o bien 0.146. (El valor p es el doble del área en la cola Iz¬ 
quierda de la distribución binomial.) Como esta área es mayor que 0.05, no se puede rechazar la hipótesis nula al nivel de 
significancia 0.05. Por lo tanto, se concluye que a este nivel no hay diferencia entre las dos máquinas. 


17.2 Resolver el problema 17.1, pero esta vez empleando la aproximación normal a la distribución binomial. 

SOLUCIÓN 

En la aproximación normal a la distribución binomial se emplea el hecho de que la puntuación z correspondiente a la can¬ 
tidad de caras es 


_X - p _X -Np 
a \JNpq 

Como en la distribución normal la variableX es discreta, en tanto que en la distribución binomial es continua, se hace una 
corrección por continuidad (por ejemplo, 3 caras es en realidad un valor que está entre 2.5 y 3.5 caras). Esto es equivalen¬ 
te a restarle 0.05 al valor deX si X > Np y sumarle 0.05 al valor deX si X < A/p. Como N = 12, p = Np = (12)(0.5) = 6 
y ( r = y / %= vTT 2^5XCL5) = 1.73, se tiene 


(3 + 0.5) - 6 
L73 


-1.45 


El valorp es el doble del área a la izquierda de -1.45. Empleando EXCEL con = 2* N0RMSDI ST( -1.45) se obtiene 
1.47. En la figura 17-1, el valor p es, aproximadamente, el área bajo la curva normal estándar a la Izquierda de -1.45, la 
cual se duplica debido a que se trata de una hipótesis de dos colas. Obsérvese cuán cercanos, uno de otro, están los dos 
valores p; el área binomial bajo los rectángulos es 0.146 y el área bajo la curva normal estándar es 0.147. 


17.3 La empresa PQR asegura que un tipo de batería fabricada por ellos tiene una duración mayor a 250 horas (h). 
Para determinar si está justificado, se mide la duración de 24 baterías producidas por esta empresa; los resul¬ 
tados se presentan en la tabla 17.3. Suponiendo que la muestra sea aleatoria, determinar al nivel de significan¬ 
cia 0.05 si lo que asegura la empresa está justificado. Resolver el problema primero a mano, dando todos los 
detalles de la prueba de los signos. Después, dar la solución empleando M INITAB. 
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SOLUCIÓN 

Sea H o la hipótesis de que la duración de las baterías de esta empresa es igual a 250 h y sea H 1 la hipótesis de que su dura¬ 
ción es mayor a 250 h. Para probar H 0 contra H 1 se emplea la prueba de los signos. Para esto, a cada entrada de la tabla 17.3 
se le resta 250 y se registra el signo de la diferencia, como se muestra en la tabla 17.4. Se observa que hay 15 signos más 
y 9 signos menos. 


Tabla 17.3 Tabla 17.4 


271 

230 

198 

275 

282 

225 

284 

219 

253 

216 

262 

288 

236 

291 

253 

224 

264 

295 

211 

252 

294 

243 

272 

268 


+ 

- 

- 

+ 

+ 

- 

+ 

- 

+ 

- 

+ 

+ 

- 

+ 

+ 

- 

+ 

+ 

- 

+ 

+ 

- 

+ 

+ 


Empleando la aproximación normal a la distribución binomlal, la puntuación z es 

(15-0.5)-24(0.5) in „ 

Z - - . - - l.UZ. 

^24(0.5) (0.5) 

Obsérvese que al restar 0.5 de 15 se hace la corrección por continuidad (15 - 0.5) = 14.5. El valorp es el área de la curva 
normal estándar, a la derecha de 1.02. (Ver la figura 17-2.) 



Z= 1.02 

Figura 17-2 El valor p es el área a la derecha dez = 1.02. 


El valorp es el área a la derecha dez = 1.02, o usando EXCEL, el área se obtiene mediante = 1- NORMSDI ST( 1. 02) 
o bien 0.1537. Dado que el valor p > 0.05, lo que asegura la empresa no se justifica. 

A continuación se presenta la solución empleando M INITAB. Los datos de la tabla 17.3 se ingresan en la columna 
1 de la hoja de cálculo deMINITAB ya esta columna se le pone como título Duración. Con la secuencia Stat —> Non- 
parametrics —> 1-samplesign se obtienen los resultados siguientes. 


Prueba de los signos para la mediana: Duración 

Sign test of median = 250.0 versus > 250.0 

N Below Equal Above P Median 

Lifetime 24 9 O 15 0.1537 257.5 

Obsérvese que la información dada aquí es la misma a la que se llegó antes en la solución de este problema. 
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17.4 En la tabla 17.5 se presentan 40 calificaciones obtenidas en un examen a nivel estatal. AI nivel de significancia 
0.05, probarla hipótesis de que la calificación mediana de todos los participantes es: a) 66 y b) 75. Resolvere! 
problema primero a mano, dando todos los detalles de la prueba de los signos, y a continuación, resolverlo 
empleando M INITAB. 


Tabla 17.5 


71 

67 

55 

64 

82 

66 

74 

58 

79 

61 

78 

46 

84 

93 

72 

54 

78 

86 

48 

52 

67 

95 

70 

43 

70 

73 

57 

64 

60 

83 

73 

40 

78 

70 

64 

86 

76 

62 

95 

66 


SOLUCIÓN 


a) Se resta 66 a cada entrada de la tabla 17.5 y se conservan sólo los signos de las diferencias, con lo que se obtiene la 
tabla 17.6, en la que se observa que hay 23 signos más, 15 signos menos y 2 ceros. Si se eliminan los 2 ceros, la mues¬ 
tra consta de 38 signos: 23 signos más y 15 signos menos. En una prueba de dos colas, usando la distribución normal 
con probabilidades \ (0.05) = 0.025 en cada cola (ver la figura. 17-3), la regla de decisión que se adopta es la siguiente: 
Aceptar la hipótesis si -1.96 < z < 1.96. 

Rechazar la hipótesis si no es así. 


Dado que 


_ X - Np _ (23 - 0.5) - (38)(0.5) 
•sfÑpq ~ V(38)(0.5)(O5) 


al nivel de significancia 0.05, se acepta la hipótesis de que la mediana es 66. 


Tabla 17.6 


+ 

+ 

- 

- 

+ 

0 

+ 

- 

+ 

- 

+ 

- 

+ 

+ 

+ 

- 

+ 

+ 

- 

- 

+ 

+ 

+ 

- 

+ 

+ 

- 

- 

- 

+ 

+ 

- 

+ 

+ 

- 

+ 

+ 

— 

+ 

0 


Obsérvese que también se puede usar 15, la cantidad de signo menos. En este caso 


(15 + 0.5) - (38)(0.5) 
v/ (38) (0.5)(0.5J 


llegándose a la misma conclusión. 



Figura 17-3 Prueba de dos colas mostrando la región crítica para a = 0.05. 
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b ) Restando 75 a cada una de las entradas de la tabla 17.5 se obtiene la tabla 17.7, en la que hay 13 signos más y 27 

signos menos. Como 


_(13 + 0.5) — (40)(0.5) _ 

Z — - — — — —Z.U 

V(40)(0.5)(0.5) 

al nivel de significancia 0.05, se rechaza la hipótesis de que la mediana sea 75. 


Tabla 17.7 


— 

— 

— 

— 

+ 

— 

— 

— 

+ 

— 

+ 

- 

+ 

+ 

— 

- 

+ 

+ 

— 

- 

- 

+ 

- 

- 

— 

- 

- 

- 

— 

+ 

- 

- 

+ 

- 

- 

+ 

+ 

- 

+ 

- 


Empleando este método se puede encontrar un intervalo de confianza de 95% para la calificación mediana en 
este examen. (Ver el problema 17.30.) 

Obsérvese que en la solución anterior se emplea el método clásico de prueba de hipótesis. En el método clásico se 
emplea a = 0.05 para determinar la reglón de rechazo para la prueba, [z < -1.96 oz > 1.96], A continuación se calcula el 
estadístico de prueba [en el inciso a) z = -1.14, y en el inciso b) z = -2.06], Si el estadístico de prueba cae en la región 
de rechazo, se rechaza la hipótesis nula. Si este estadístico no cae en la región de rechazo, no se rechaza la hipótesis nula. 

En la solución de M INITAB se usa el método del valor p. Se calcula el valor p y si este valor es menor a 0.05, se 
rechaza la hipótesis nula. SI el valor p es mayor que 0.05, no se rechaza la hipótesis nula. Usando tanto el método clásico 
como el método del valor p se llega a la misma decisión. 

La solución empleando M UMITA El es la que se muestra a continuación. Para probar que la mediana es 66, el resul¬ 
tado es el siguiente 

Prueba de los signos para la mediana: Calificaciones 

Sign test of median = 66.00 versus not = 66.00 

N Below Equal Above P Median 

Grade 40 15 2 23 0.2559 70.00 

Como el valor p es mayor que 0.05, no se rechaza la hipótesis nula. 

El resultado para probar que la mediana es 75 es 

Prueba de los signos para la mediana: Calificaciones 

Sign test of median = 75.00 versus not = 75.00 

N Below Equal Above P Median 

Grade 40 27 O 13 0.0385 70.00 

Como el valor p es <0.05, se rechaza la hipótesis nula. 

LA PRUEBA U DE MANN-WHITNEY 

17.5 Volverá la tabla 17.2. Al nivel de significancia 0.05, determinar si hay alguna diferencia entre los cables hechos 
con la aleación I y los hechos con la aleación 11. Resolver el problema, primero a mano, dando todos los deta¬ 
lles de la prueba ti de M ann-Whltney, y después usando M I IMITA ES. 

SOLUCIÓN 

La solución se encuentra siguiendo los pasos 1, 2 y 3 (antes descritos en este capítulo): 

Paso 1. Se juntan los 18 valores muéstrales y se ordenan demenor a mayor, con lo cual se obtiene el primer renglón 
de la tabla 17.8. En el segundo renglón se numeran estos valores del 1 al 18, con lo que se obtienen los rangos. 





Problemas resueltos 455 


Tabla 17.8 


10.7 

11.8 

12.6 

12.9 

14.1 

14.7 

15.2 

15.9 

16.1 

16.4 

17.8 

18.3 

18.9 

19.6 

20.5 

22.7 

24.2 

25.3 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 


Paso 2. Para hallar la suma de los rangos de cada muestra, se rescribe la tabla 17.2 con los rangos correspondien¬ 
tes a cada valor de acuerdo con la tabla 17.8, y de esta manera se obtiene la tabla 17.9. La suma de los rangos correspon¬ 
diente a la aleación I es 106 y la suma de los rangos correspondientes a la aleación II es 65. 


Tabla 17.9 


Aleación 1 

Aleación II 

Resistencia 
del cable 

Rango 

Resistencia 
del cable 

Rango 

18.3 

12 

12.6 

3 

16.4 

10 

14.1 

5 

22.7 

16 

20.5 

15 

17.8 

11 

10.7 

1 

18.9 

13 

15.9 

8 

25.3 

18 

19.6 

14 

16.1 

9 

12.9 

4 

24.2 

17 

15.2 

7 


Suma 106 

11.8 

2 



14.7 

_6 

Suma 65 


Paso 3. Como la muestra de la aleación I es la menor, N 1 = 8 y A/ 2 = 10. Las correspondientes sumas de los rangos 
son R 1 = 106 y R 2 = 65. Entonces 


Por lo queo-y 


Pu — 


N x N 2 

2 


11.25 y 


U = N { N 2 + 

( 8 )( 10 ) 


N^Ni + l) 


7?, =(8)(10) + 


(8)(9) 


2 NiN2{Ni+Ní + 1) 
= 40 a v = - - - 


(8)(10)( 19) 
12 


106= 10 
= 126.67 


U — Pu 
oc¬ 


io-40 
11.25 


-2.67 


Dado que la hipótesis H 0 que se está probando es queno hay diferencia entre las aleaciones, se requiere una prueba de dos 
colas. La regla de decisión al nivel de significancia 0.05 es: 

A ceptar H 0 si -1.96 < z < 1.96. 

Rechazar H 0 si no es así. 

Como z = -2.67, se rechaza H 0 y se concluye que al nivel de significancia 0.05, sí hay diferencia entre las aleaciones. 

A continuación se presenta la solución a este problema obtenida con M INITAB. Primero, se Ingresan los datos de la 
aleación I en la columna C1 y los datos de la aleación II en la columna C2, y a las columnas se les pone como encabezado 
Aleaclónl yAIeaclónll.M ediante la secuencia Stat —► Nonparametrics—> M ann-Whitney se obtienen los resul¬ 
tados siguientes. 


Prueba de Mann-Whitney e intervalo de confianza: Aleaciónl y Aleaciónll 

N Median 
Alloyl 8 18.600 

AlloyII 10 14.400 
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Point estímate for ETA1-ETA2 is 4.800 
95.4 Percent CI for ETA1-ETA2 is (2.000, 9.401) 

W= 106.0 

Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.0088 

Los resultados de M INITAB dan la resistencia mediana de los cables de cada muestra, una estimación puntual de la dife¬ 
rencia entre las medianas poblacionalesf ETA1-ETA2), un intervalo de confianza para la diferencia entre las medianas 
poblacionales, la suma de los rangos de la primera variable (l/l/= 106) y el valor p para dos colas = 0.0088. Como el valor 
p < 0.05, se rechaza la hipótesis nula. Se concluye que con la aleación I se obtienen cables más resistentes. 


17.6 Con los datos del problema 17.5, verificar las fórmulas (6) y (7) de este capítulo. 

SOLUCIÓN 

a) Como los valores de U que se obtienen con las muestras 1 y 2 son 

U¡ =N,N 2 + N,(N ^ +1 ' > -R, = ( 8 )( 10 )+^^ 1 - 106= 10 
U 2 = N,N 2 + Nl( ' N ; + - R 2 = (8)(10) + (10) o (11) -65 = 70 


se tiene U 1 + U 2 m 10 + 70 n 80 y A/^ = (8)(10) = 80. 
b) Como R 1 = 106 y R 2 = 65, setieneRj + R 2 = 106 + 65 = 171 y 

N{N+\) (Ni + N 2 )(N¡ +N 2 + 1 ) ( 18 )( 19 ) 


= 171 


17.7 Resolver el problema 17.5 usando el estadístico U de la muestra de la aleación II. 

SOLUCIÓN 

Para la muestra de la aleación II 


U = NiN 2 + Nl ^ + - R 2 = (8)(10) + - 65 = 70 

rln monnr* ruin 70 — 40 

de manera que z =-= -. _ — = 2.67 

M (T u 11.25 

Este valor dez es el negativo de la z del problema 17.5, por lo que se emplea la cola derecha de la distribución normal, en 
lugar de la cola izquierda. Como este valor dez también se encuentra fuera de -1.96 <z< 1.96, la conclusión es la misma 
que en el problema 17.5. 


17.8 Un profesor tiene dos grupos de psicología: uno en la mañana, con 9 alumnos, y otro en la tarde con 12 alum¬ 
nos. En el examen final, que es el mismo para los dos grupos, las calificaciones obtenidas son las que se mues¬ 
tran en la tabla 17.10. ¿Puede concluirse al nivel de significancia 0.05 que en el grupo de la mañana el 
rendimiento sea menor que en el grupo de la tarde? Resolver el problema, primero a mano, dando todos los 
detalles de la prueba U de M ann-Whitney y después dar la solución empleando M IN ITAB. 


Tabla 17.10 


Grupo matutino 

73 

87 

79 

75 

82 

66 

95 

75 

70 

Grupo vespertino 

86 

81 

84 

88 

90 

85 

84 

92 

83 91 53 84 
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SOLUCIÓN 

Paso 1. En la tabla 17.11 se muestran las calificaciones con sus rangos respectivos. Obsérvese que el rango que corres¬ 
ponde a las dos calificaciones 75 es ¿(5 + 6) = 5.5 y el que corresponde a los tres 84 es (,(11 + 12 + 13) = 12. 


Tabla 17.11 


53 

66 

70 

73 

75 75 

79 

81 

82 

83 

84 84 84 

85 

86 

87 

88 

90 

91 

92 

92 

1 

2 

3 

4 

5.5 

7 

8 

9 

10 

12 

14 

15 

16 

17 

18 

19 

20 

21 


Paso 2. Rescribiendo la tabla 17.10 en términos de los rangos, se obtiene la tabla 17.12. 

Verificación: R 1 = 73, R 2 = 158 y N = N 1 + W 2 = 9 + 12 = 21; por lo tanto, R 1 + R 2 = 73 + 158 = 231 y 


N(N+ 1) 
~2 


( 21 )( 22 ) 
2 


231 = R x +R 2 


Tabla 17.12 



Suma de 
rangos 

Grupo matutino 

4 16 7 5.5 9 2 21 5.5 3 

73 

Grupo vespertino 

15 8 12 17 18 14 12 20 10 19 1 12 

158 


Paso 3. 


Hu 


n x n 2 

2 


U = N x N 2 + 

(9X^) = 54 
2 


^±i)_y, 1=(9) (i 2 ) + WM_73 = 80 

2 TW^+i^+l) (9) (12) (22) , no 

°u = -J2-=-12-= 198 


Por lo tanto, 


U ~ i l u 


80-54 

14.07 


1.85 


El valor p para una cola se obtiene empleando la expresión deEXCEL =1- NORMSDI ST( 1. 85) que da 0.0322. Como el 
valor p <0.05, se concluye que el desempeño del grupo matutino no es tan bueno como el del turno vespertino. 

La solución de M I IMITA B al problema es como sigue. Primero se introducen los datos de los valores del turno matu¬ 
tino y del vespertino en las columnas C1 y C 2 y se nombra a esas columnas matuti no yvesperti no.Con la secuen¬ 
cia Stat —> Nonparametrics—> Mann-Whitney se obtienen los resultados siguientes. 


Prueba de Mann-Whitney e intervalo de confianza: Matutino, Vespertino 

N Median 
Morning 9 75.00 

Afternoon 12 84.50 

Point estímate for ETA1-ETA2 is -9.00 

95.7 Percent CI for ETA1-ETA2 is (-15.00, 2.00) 

W= 73.0 

Test of ETA1 = ETA2 vs ETA1 < ETA2 is significant at 0.0350 
The test is significant at 0.0348 (adjusted for ties) 


En los resultados de M INITAB seda la calificación mediana de cada muestra, una estimación puntual de la diferencia entre 
las medianas poblacionales, un intervalo de confianza para la diferencia entre las medianas poblacionales, la suma de los 
rangos de la primera variable (en este caso, el grupo matutino) y el valor p para una cola que es = 0.0350. Como el valor 
p es menor que 0.05, se rechaza la hipótesis nula. Se concluye que la clase matutina no tiene tan buen desempeño como la 
clase vespertina. 
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17.9 Dados los datos de la tabla 17.13, encontrar U usando: a) la fórmula (2) de este capítulo y b) el método de 
conteo (descrito en la Nota 4 de este capítulo). 

SOLUCIÓN 


a) Ordenando todos los datos juntos, de menor a mayor, y asignándoles un rango del 1 al 5, se obtiene la tabla 17.14. 
Sustituyendo los datos de la tabla 17.13 por sus rangos correspondientes se obtiene la tabla 17.15, en la que se dan las 
sumas de los rangos, que son R 1 = 5 y R 2 = 10. Como N 1 = 2 y A/ 2 = 3, el valor U para la muestra 1 es 


U = NlN2+ N ^ + V - Rl = (2)(3) + (2 p 


-5 = 4 


De igual manera se encuentra el valor U para la muestra 2, que es U = 2. 


Tabla 17.13 Tabla 17.14 


M uestra 1 

22 10 

M uestra 2 

17 25 14 


Datos 

10 14 17 22 25 

Rango 

1 2 3 4 5 


Tabla 17.15 



Suma de 
los rangos 

M uestra 1 

4 

1 


5 

M uestra 2 

3 

5 

2 

10 


b ) Sustituyendo los valores de la tabla 17.14 con I o II, dependiendo si el valor pertenece a la muestra 1 o a la muestra 2, 
el primer renglón de la tabla 17.14 se transforma en 


Dato 


En esta tabla se ve que 

N úmero de valores de la muestra 1 que preceden al primer valor de la muestra 2 =1 
Número de valores de la muestra 1 que preceden al segundo valor de la muestra 2 = 1 
N úmero de valores de la muestra 1 que preceden al tercer valor de la muestra 2 =2 

Total = 4 

Por lo tanto, el valor de U que corresponde a la primera muestra es 4. 

De Igual manera, 

Número de valores de la muestra 2 que preceden al primer valor de la muestra 1 =0 
Número de valores de la muestra 2 que preceden al segundo valor de la muestra 1 = 2 

Total = 2 

Por lo tanto, el valor de U que corresponde a la segunda muestra es 2. 

Obsérvese que como N 1 = 2 y A/ 2 = 3, estos valores satisfacen U 1 + U 2 = A/ 1 /V 2 ; es decir, 4 + 2 = 6 = 
(2) (3) = 6. 
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17.10 Una población consta de los valores 7, 12 y 15. De esta población se toman dos muestras sin reposición: la 

muestra 1 consta de un valor y la muestra 2 consta de dos valores. (Estas dos muestras agotan la población.) 

a) Encontrar la distribución muestral deU y su gráfica. 

b) Encontrar la media y la varlanza de la distribución del Inciso a). 

c) Verificar los resultados hallados en el Inciso b) empleando la fórmula (3) de este capítulo. 

SOLUCIÓN 

a) Se elige el muestreo sin reposición para evitar empates, los cuales se presentarían si, por ejemplo, el valor 12 apare¬ 
ciera en ambas muestras. 

Como se observa en la tabla 17.16, hay 3-2 = 6 posibilidades para elegir las muestras. Debe notarse que tam¬ 
bién se pueden emplear sólo los rangos 1, 2 y 3, en lugar de 7,12 y 15. El valor U de la tabla 17.16 es el hallado para 
la muestra 1, pero si se usa la U para la muestra 2, se obtendrá la misma distribución. 


Tabla 17.16 


M uestra 1 

M uestra 2 

U 

7 

12 15 

2 

7 

15 12 

2 

12 

7 15 

1 

12 

15 7 

1 

15 

7 12 

0 

15 

12 7 

0 


En la figura 17-4 se muestra una gráfica de esta distribución, en la que fes la frecuencia. También puede grad¬ 
earse la distribución de probabilidad del/; en ese caso, Pr{U = 0} = Pr{L/ = 1} = Pr{Lí = 2} = ±. La gráfica que se 
requiere es igual a la de la figura 17-4, pero con i y i en lugar de 1 y 2. 


2.50 


2.25 


2.00 


1.75 


1.50 


Figura 17-4 MINITAB, gráfica déla distribución muestral deü con N 1 = 1 y A/ 2 = 2. 
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17.11 


b ) 


La media y la varianza de los valores de la tabla 17.16 son 

2 + 2 + 1 + 1 + 0+0 
Mu — - 7 - 


= 1 


2 (2 - l ) 2 + (2 - l ) 2 + (1 - l ) 2 + (1 - l ) 2 + (0 - l ) 2 + (0 - l ) 2 

a U - -7- 


2 

3 


c) De acuerdo con la fórmula (3) 


N x N 2 (1)(2) , 

^ = — = — =1 

2 N\N 2 (N\ + N 2 + 1) (1)(2)(1+2+1) 2 

° v = 12 = 12 = 3 

lo que coincide con el inciso a). 


a) Con los datos del problema 17.9, encontrar la distribución muestral del/ y graficaria. 

b) G raficar la correspondiente distribución de probabilidad del/. 

c) Obtener la media y la varianza de U directamente a partir de los resultados del Inciso a). 

d) Verificare! Inciso c) empleando la fórmula (3) de este capítulo. 


SOLUCIÓN 


a) En este caso hay 5 ■ 4 ■ 3 ■ 2 = 120 posibilidades para elegir los valores de las dos muestras y el método del problema 
17.9 resulta demasiado laborioso. Para simplificar este procedimiento hay que fijar la atención en la muestra más 
pequeña (de tamaño A/j = 2) y en las posibles sumas de sus rangos, R v La suma de los rangos de la muestra 1 es la 
menor cuando la muestra consta de los dos números de menor rango (1, 2); entonces R : = 1 + 2 = 3. De Igual mane¬ 
ra, la suma de los rangos de la muestra 1 es la mayor cuando la muestra consta de los dos números de mayor rango 
(4,5); entonces R x = 4 + 5 = 9. Por lo tanto, varía desde 3 hasta 9. 

En la columna 1 de la tabla 17.17 se presentan estos valores deR 2 (desde 3 hasta 9) y en la columna 2 se mues¬ 
tran los valores correspondientes de la muestra 1, cuya suma es R v En la columna 3 se da la frecuencia (o el número) 
de las muestras cuya suma es R-p por ejemplo, hay f = 2 muestras para las que R 1 = 5. Como N 1 = 2 y W 2 = 3, se 
tiene 


u = N x N 2 + _ y?! = (2)(3)+++ 


R, = 9 -R¡ 


A partir de lo cual pueden encontrarse los valores correspondientes de U en la columna 4 de la tabla; obsérvese que 
como R : varía de 3 a 9, U varía de 6 a 0. La distribución muestral se da en las columnas 3 y 4 y la gráfica en la figura 
17-5. 



-1 0 1234567 

u 

Figura 17-5 EXCEL, gráfica de la distribución muestral deü con N 2 = 2 y W 2 = 3. 
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b ) La probabilidad de que U = R 1 (es decir, Pr {U = RJ) se presenta en la columna 5 de la tabla 17.17 y se obtiene 
hallando la frecuencia relativa. La frecuencia relativa se halla dividiendo cada frecuencia entre la suma de todas las 
frecuencias, o sea entre 10; por ejemplo, Pr{C7 = 5} = = 0.2. En la figura 17.6 se muestra la gráfica de la distri¬ 

bución de probabilidad. 


Tabla 17.17 


«1 

Valores de la muestra 1 

f 

U 

Pr{U =R l } 

3 

(1,2) 

1 

6 

0.1 

4 

(1,3) 

1 

5 

0.1 

5 

(1,4), (2.3) 

2 

4 

0.2 

6 

(1,5), (2, 4) 

2 

3 

0.2 

7 

(2, 5), (3, 4) 

2 

2 

0.2 

8 

(3,5) 

1 

1 

0.1 

9 

(4,5) 

1 

0 

0.1 


0.18 - 


~ 0.15 - 


0.12 - 



Figura 17-6 SPSS, gráfica déla distribución de probabilidad deU con N 1 = 2 y W 2 = 3. 


c) De acuerdo con las columnas 3 y 4 de la tabla 17.17, se tiene 

J2fU_ (1)(6) + (1)(5) + (2) (4) + (2)(3) + (2)(2) + (1)(1) + (1)(0) 


Hu — U — 


E/ 


1 + 1 + 2 + 2 + 2 + 1 + 1 


= 3 


2 E f(u-üy 

a U =- 


E / 

(1)(6 —3) 2 + (l)(5 —3) 2 + (2)(4-3) 2 + (2)(3 —3) 2 + (2)(2 —3) 2 + (1)(1 - 3) 2 + (1)(0 - 3) 2 

10 


= 3 


Otro método 

a 2 v =U--U ¿ = 


2 _7S _ (1)(6) 2 + d)(5) 2 + (2)(4) 2 + (2)(3) 2 + (2)(2) 2 + (1)(1) 2 + (1)(0) 2 


— (3)= 3 


10 
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d) De acuerdo con la fórmula (3), empleando A/ 1 = 2y/V 2 = 3, se tiene 

_ N x N 2 _ (2)(3) 2 _ iV^Aq+iV. + l) _ (2)(3)(6) _ 

2 2 ° u 12 12 

17.12 Si N números de un conjunto se ordenan del 1 al N, probar que la suma de los rangos es [N (N + l)]/2. 

SOLUCIÓN 

Sea R la suma de los rangos. Entonces se tiene 

R= 1 + 2 + 3 +--- + {N-\) + N (16) 

R = N+(N-1) + (N- 2) + ---+ 2 +1 (17) 

en donde la suma de la ecuación (17) se obtiene invirtiendo el orden de los sumandos de la ecuación (16). Sumando las 
ecuaciones (16) y (17) se obtiene 

2R = (N + 1) + (N + 1) + (N + 1) + ■ ■ ■ + {N + 1) + (N + 1) = N(N + 1) 

como en esta suma (N + 1) se presenta N veces, entonces R = [A/(/V + l)]/2. Esto también puede obtenerse empleando una 
fórmula del álgebra elemental en serles y progresiones aritméticas. 

17.13 Si fii y fi, son, respectivamente, las sumas de los rangos en las muestras 1 y 2 en una prueba ti, demostrar que 

R t +R 2 =[N(N+ 1)1/2. 

SOLUCIÓN 

Se supone que en los datos muéstrales no hay empates. Entonces, R : debe ser la suma de algunos de los rangos (números) 
del conjunto 1,2,3,..., N, y R 2 debe ser la suma de los rangos restantes del conjunto. Por lo tanto, R : + R 2 debe ser la suma 

de todos los rangos del conjunto; es decir, R 1 + R 2 = 1 + 2 + 3 h -h/V = [A/(W + l)]/2, de acuerdo con el problema 

17.12. 


LA PRUEBA H DE KRUSKAL-WALLIS 

17.14 Una empresa va a comprar una de cinco máquinas: A, B, C , D oE.Enun experimento para determinar si hay 
diferencia en el desempeño de estas máquinas, cinco operadores experimentados trabajan con cada una de las 
cinco máquinas durante un mismo tiempo. En la tabla 17.18 se muestra la cantidad de unidades obtenida con 
cada máquina. A los niveles de significancia: a) 0.05 y b) 0.01, probar la hipótesis de que no hay diferencia 
entre las máquinas. Resolver el problema primero a mano, dando todos los detalles de la prueba H deKruskal- 
Wallls; después, resolver el problema usando M INITAB. 


Tabla 17.18 


A 

68 

72 

77 

42 

53 

B 

72 

53 

63 

53 

48 

C 

60 

82 

64 

75 

72 

D 

48 

61 

57 

64 

50 

E 

64 

65 

70 

68 

53 


Tabla 17.19 



Suma de 
los rangos 

A 

17.5 

21 

24 

1 

6.5 

70 

B 

21 

6.5 

12 

6.5 

2.5 

48.5 

C 

10 

25 

14 

23 

21 

93 

D 

2.5 

11 

9 

14 

4 

40.5 

E 

14 

16 

19 

17.5 

6.5 

73 
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SOLUCIÓN 


Dado que hay cinco muestras (A, B,C, D y £), k = 5. Como cada muestra consta de cinco valores, se tiene N 1 = N 2 = 
N 3 = n 4 = a / 5 = 5 y N = + N 2 + A / 3 + A / 4 + A / 5 = 25. Ordenando todos los valores en forma creciente de magnitud 

y asignando a los empates los rangos adecuados, la tabla 17.18 se transforma en la tabla 17.19, en la que en la columna del 
extremo derecho se muestran las sumas de los rangos. De acuerdo con la tabla 17.19 se tiene R 4 = 70 , R 2 = 48.5, R? 3 = 93, 
R 4 = 40.5 y R 5 = 73. Por lo tanto, 


12 y' R j 

~ N(N + 1) j-f Ñj 


3(N+ 1) 


12 

(25) (26) 


(70)! 

5 


(48.5) 2 
5 


(93 ) 2 

5 


(40) 2 

5 


(73 f 
5 


3(26) = 6.44 


Para k- 1 = 4 grados de libertad al nivel de significancia 0.05, en el apéndice IV se encuentra xls = 9.49. Como 6.44 < 
9.49, al nivel de significancia 0.05, no se puede rechazar la hipótesis deque no haya diferencia entre las máquinas y, por lo 
tanto, tampoco se podrá rechazar al nivel de significancia 0.01. E n otras palabras, se puede aceptar la hipótesis (o postergar 
la decisión) de que, a ambos niveles, no hay diferencia entre las máquinas. 

Obsérvese que este problema ya fue resuelto antes empleando el análisis de varianza (ver problema 16.8) y se llegó 
a la misma conclusión. 

A continuación se presenta la solución del problema usando M 1 IMITA B. Primero, es necesario ingresar los datos en 
la hoja de cálculo de M INITAB. La estructura que deben tener los datos es la siguiente: 


ow 

Machine 

Units 

1 

1 

68 

2 

1 

72 

3 

1 

77 

4 

1 

42 

5 

1 

53 

6 

2 

72 

7 

2 

53 

8 

2 

63 

9 

2 

53 

10 

2 

48 

11 

3 

60 

12 

3 

82 

13 

3 

64 

14 

3 

75 

15 

3 

72 

16 

4 

48 

17 

4 

61 

18 

4 

57 

19 

4 

64 

20 

4 

50 

21 

5 

64 

22 

5 

65 

23 

5 

70 

24 

5 

68 

25 

5 

53 


Con la secuencia Stat—> Nonparametrics —» Kruskal-Wallis se obtienen los resultados: 


Prueba de Kruskal-Wallis: unidades versus máquinas 


Machine 

N 

Median 

Ave Rank 

Z 

1 

5 

68.00 

14.0 

0.34 

2 

5 

53.00 

9.7 

-1.12 

3 

5 

72.00 

18.6 

1.90 

4 

5 

57.00 

8.1 

-1.66 

5 

5 

65.00 

14.6 

0.54 

Overall 

25 


13.0 
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H = 6.44 DF = 4 P = 0.168 

H = 6.49 DF = 4 P = 0.165 (adjustedforties) 

Obsérvese que se dan dos valoresp. U no es el valor p ajustado, para los empates que se presentan al dar los rangos, 
y el otro no es ajustado. Es claro que, a los niveles de significancia 0.05 y 0.01, las máquinas no son estadísticamente dife¬ 
rentes respecto a la cantidad de unidades que producen, ya que los dos valores p superan con mucho ambos niveles. 

17.15 Resolver el problema 17.14 usando los paquetes de software STATISTIX y SPSS. 

SOLUCIÓN 

El archivo con los datos se estructura como en el problema 17.14. Usando STATISTIX, la secuencia Statistics — > One, 
Two, M ulti-sampletests —> Kruskal-WallisOne-wayAOV Test proporciona los resultados que se muestran a continua¬ 
ción. Comparar estos resultados con los obtenidos en el problema 17.14. 

Statistix 8.0 

Kruskal-Wallis One-way Nonparametrics AOV para unidades por máquina 



Mean 

Sample 

Machine 

Rank 

Size 

1 

14.0 

5 

2 

9.7 

5 

3 

18.6 

5 

4 

8 .1 

5 

5 

14.6 

5 

Total 

13.0 

25 

Kruskal- 

-Wallis Statistic 


p-Value, 

, Using Chi-Squared Approximation 


6.4949 

0.1651 


Los resultados de STATISTIX coinciden con los resultados de M INITA B ajustados para empates. 
Los resultados de SPSS también coinciden con los resultados de M IN ITA B ajustados para empates. 


Prueba de Kruskal-Wallis 


Rangos 


Máquina 

N 

Rango medio 

Unidades 1.00 

4 

14.00 

2.00 

5 

9.70 

3.00 

5 

18.60 

4.00 

5 

8.10 

5.00 

5 

14.60 

Total 

25 



Estadísticos de prueba a,b 



Unidades 

Ji cuadrada 

6.495 

df 

4 

Significación asintótica 

.165 


‘Prueba de Kruskal-Wallis 
Variable agrupada: máquina 
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17.16 En la tabla 17.20 se da la cantidad de DVD rentados durante el pasado año por los profesores, abogados y 
médicos de una muestra aleatoria. Usar la prueba H de Kruskal-WalIis del paquete SAS para probar la hipó¬ 
tesis nula de que las distribuciones de las rentas son las mismas en los tres grupos de profesionistas. Emplear 
el nivel 0.01. 


Tabla 17.20 


Profesores 

Abogados 

M édlcos 

18 

2 

14 

4 

16 

30 

5 

21 

11 

9 

24 

1 

20 

5 

7 

26 

2 

5 

7 

50 

14 

17 

10 

7 

43 

7 

16 

20 

49 

14 

24 

35 

27 

7 

1 

19 

34 

45 

15 

30 

6 

22 

45 

9 

20 

2 

24 

10 

45 

36 


9 

50 



44 



3 



SOLUCIÓN 

Los datos se ingresan en dos columnas. U na columna contiene 1,2 o 3 que corresponden a profesores, abogados y médicos; 
la otra columna contiene la cantidad de DVD rentados. Con la secuencia Statlstlcs^ANOVA -> Nonparametric Oneway 
ANOVA de SAS se obtienen los resultados siguientes. 


The NPAR1WAY Procedure 


Wilcoxon Scores (Rank Sums) for Variable number 
Classified by Variable Profession 

Sum of Expected Std Dev Mean 

Profession N Scores Under HO Under HO Score 

ffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff 


i 

18 

520.50 

495.0 

54.442630 

29.916667 

2 

20 

574.50 

550.0 

55.770695 

28.725000 

3 

16 

390.00 

440.0 

52.735539 

24.375000 


Average scores were used for fies. 
Kruskal-Wallis Test 


Chi-Square 

DF 

Pr > Chi-Sqaure 


0.9004 

2 

0.6375 
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El valor p se da como Pr >Chi-Square 0.6375. Como el valor p es mucho mayor que 0.05, no se rechaza la 
hipótesis nula. 


PRUEBA DE LAS RACHAS PARA ALEATORIEDAD 


17.17 En 30 lanzamientos de una moneda se obtiene la siguiente secuencia de caras (H) y cruces (T): 

HTTHTHHHTHHTTHT 

HTHHTHTTHTHHTHT 

a) Determinar la cantidad V de rachas. 

b) Al nivel de significancia 0.05, probar si esta secuencia es aleatoria. 

Resolver el problema primero a mano, dando todos los detalles de las pruebas de las rachas para aleatoriedad, 
y después dar la solución al problema usando M INITA B. 


SOLUCIÓN 


a) Empleando una línea vertical para separar las rachas 

H | T T | H | T | H H H|T|H H|T T|H|T| 

H|T | H H|T| H |T T|H|T|H H|T|H|T| 
se observa que la cantidad de rachas es y = 22. 

b) En esta muestra de lanzamientos hay N 1 = 16 caras y W 2 = 14 cruces, y de acuerdo con el Inciso a), la cantidad de 
rachas es 1/ = 22. Por lo tanto, de acuerdo con las fórmulas (13) de este capítulo, se tiene 


Pv — 


2(16)(14) 

16+14 


+ 1 = 15.93 


2 _ 2(16)( 14) [2( 16)( 14) - 16 - 14] 
(16+ 14) 2 (16+ 14- 1) 


o a v = 2.679. Por lo tanto, la puntuación z correspondiente a V = 22 rachas es 


V-n v _ 22- 15.93 
<j v ~ 2.679 


2.27 


En una prueba de dos colas, al nivel de significancia 0.05, se aceptará la hipótesis H 0 de aleatoriedad si -1.96 < z < 
1.96 y se rechazará si no es así (ver figura 17-7). Como el valor obtenido para z es 2.27 > 1.96, se concluye, al nivel 
de significancia 0.05, que los lanzamientos no son aleatorios. La prueba indica que hay demasiadas rachas, lo que 
indica un patrón cíclico en los lanzamientos. 



Figura 17-7 Región de rechazo en la curva normal estándar, al nivel de significancia 0.05. 
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Si se emplea la corrección por continuidad, la puntuación z dada arriba se convierte en 


(22-0.5)- 15.93 
2.679 


2.08 


y se llega a la misma conclusión. 

La solución del problema empleando M INITAB es como se indica a continuación. En la columnaC1 se ingre¬ 
san los datos. Cada cara se ingresa como un número 1 y cada cruz como un 0. A la columna 1 se le pone como título 
Col n (moneda). Con la secuencia de M INITAB Stat -» Nonparametrics -» Runs Test se obtienen los resultados 
siguientes. 

Prueba de las rachas: Moneda 

Runs test for Coin 

Runs above and below K = O.533333 

The observed number of runs = 22 
The expected number of runs = 15.9333 
16 Observations above K 14 below 
p-value = 0.024 


El valor K corresponde a la media de ceros y unos en la columna 1. La cantidad de observaciones mayores y 
menores a K es la cantidad de caras y cruces en los 30 lanzamientos de la moneda. El valor p es igual a 0.0235. Como 
este valor p es menor que 0.05, se rechaza la hipótesis nula. La cantidad de rachas no es aleatoria. 


17.18 En una muestra de 48 herramientas producidas con una máquina se encuentra la siguiente secuencia de herra¬ 
mientas buenas (G) y defectuosas (D): 

GGGGGGDDGGGGGGGG 

GGDDDDGGGGGGDGGG 

GGGGGGDDGGGGGDGG 


AI nivel de significancia 0.05, probar la aleatoriedad de la secuencia. U sar también SPSS para probar la alea- 
toriedad de la secuencia. 

SOLUCIÓN 

El número de letras D es N : = 10 y el número de letras G es A/ 2 = 38; el número de rachas es 1/ = 11. Por lo tanto, la media 
y la varianza son 


_ 2( 10) (38) 
^ v ~ 10 + 38 


+ 1 = 16.83 


^ _ 2(10)(38)[2(10)(38)- 10- 38] 
(10 4- 38) 2 ( 10 + 38 — 1) 


de manera que a v = 2.235. 

En una prueba de dos colas, al nivel de significancia 0.05, se acepta la hipótesis H 0 de aleatoriedad si -1.96 < z < 
1.96 (ver figura 17-7), y se rechaza si no es así. Como la puntuación z que corresponde a 1/ = 11 es 


V — p,y _ 11 — 16.83 
a v ~ 2.235 


-2.61 


y -2.61 < -1.96, se rechaza H 0 al nivel 0.05. 

La prueba muestra que hay muy pocas rachas, lo que indica que hay una acumulación (o agrupación) de herramien¬ 
tas defectuosas. En otras palabras, parece haber un patrón de tendencia en la producción de herramientas defectuosas. Se 
recomienda un examen del proceso de producción. 
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Con la secuencia Analyze^ Nonparametric Tests -> Runsde SPSS se obtienen los resultados que se dan a con¬ 
tinuación. Si las G se reemplazan por unos y las D por ceros, el valor de prueba (Test Valué), 0.7917, es la media de estos 
valores. Los demás valores que se dan en los resultados son A/ 1 = 10, N 2 = 38, Suma = 48 y V = 11. El valor obtenido para 
z es el valor con corrección por continuidad. A esto se debe que el valor z difiera del valor z calculado arriba. El término 
As y mp. S i g, ( 2-t a i I ed) es el valor p para dos colas correspondiente a z = -2.386. Como se ve, los resultados de 
SPSS contienen la misma información que se halló a mano. Sólo hay que saber interpretarla. 


Prueba de rachas 



Calidad 

Valor de prueba 3 

.7917 

Casos < Valor de prueba 

10 

Casos > = Valor de prueba 

38 

Total de casos 

48 

Número de rachas 

11 

Z 

-2.386 

Asymp. Sig. (2 colas) 

.017 


a Media 


17.19 a) Formar todas las secuencias posibles que contengan tres a y dos b, y dar la cantidad V de rachas corres¬ 
pondientes a cada secuencia. 

b) Obtener la distribución muestral de V y su gráfica. 

c) Obtener la distribución de probabilidad de 1/ y su gráfica. 

SOLUCIÓN 


a) La cantidad de secuencias con tres a y dos ó es 



Estas secuencias se muestran en la tabla 17.21, dando también la cantidad de rachas correspondiente a cada secuen¬ 
cia. 

b) En la tabla 17.22 seda la distribución muestral del/ (obtenida a partir de la tabla 17.21), en la que V denota la cantidad 
de rachas y f su frecuencia. Así, por ejemplo, la tabla 17.22 indica que hay un 5, cuatro 4, etc. En la figura 17-8 se 
muestra la gráfica correspondiente. 


Tabla 17.21 Tabla 17.22 


Secuencia 

Rachas (V) 

a 

a 

a 

b 

b 

2 

a 

a 

b 

a 

b 

4 

a 

a 

b 

b 

a 

3 

a 

b 

a 

b 

a 

5 

a 

b 

b 

a 

a 

3 

a 

b 

a 

a 

b 

4 

b 

b 

a 

a 

a 

2 

b 

a 

b 

a 

a 

4 

b 

a 

a 

a 

b 

3 

b 

a 

a 

b 

a 

4 


V 

f 

2 

2 

3 

3 

4 

4 

5 

1 
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c) La distribución de probabilidad del/, graficada en la figura 17-9, se obtiene de la tabla 17.22 dividiendo cada frecuen¬ 
cia entre la frecuencia total 2 + 3 + 4 + 1 = 10. Por ejemplo, Pr{V = 5} = i = 0.1. 

17.20 En el problema 17.19, obtener directamente de los resultados ahí obtenidos: a) la media y b) la varlanza de la 
cantidad de rachas. 


Gráfica de f VS V 

4 -I * 


3 - * 


2 - * 


1 - * 
—i-J-i-r 

2 3 4 5 

1/ 


Figura 17-8 STATISTIX, gráfica de la distribución muestral del/. 


0.45 



Figura 17-9 EXCEL, gráfica déla distribución de probabilidad del/. 


SOLUCION 

a) De acuerdo con la tabla 17.21, se tiene 

2 + 4+ 34-5 + 3 + 4 + 2 + 4 + 3 + 4 17 

Mr --íó--y 

Otro método 

De acuerdo con la tabla 17.21, con el método de los datos agrupados se tiene 

Z/V (2) (2) + (3) (3) + (4) (4) + (1) (5) 17 


Mv — 


E / 


2+3+4+1 
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b) Empleando el método de los datos agrupados para calcular la varianza, de acuerdo con la tabla 17.22, se tiene 


2 E f{v-vy 

a v = 


E / 


1 

lo 


17 V 


17 ' 


(2)(2- y ! +(3)(3--) + (4) ( 4 - — ) + (1) ( 5 — 


17' 


17' 


21 

25 


Otro método 

Como en el capítulo 3, la varianza está dada por 

a 2 p2 _ (3)(2) 2 + (3)(3) 2 + (4)(4) 2 + (1)(5) 2 /17\ 2 _21 

v 10 \5 J 25 


17.21 Repetir el problema 17.20 empleando las fórmulas (13) de este capítulo. 

SOLUCIÓN 


Como hay tres a y dos b, se tiene que A/j = 3 y A/ 2 = 2. Por lo tanto, 


a) 


2N\N 2 , , 2(3)(2) 

^-ETT7V2 + 1 ^TTT 


17 

T 


2N\N 2 (2N\N 2 - TV, - N 2 ) _ 2(3)(2)[2(3)(2) - 3 - 2] _ 21 
(TV! +7V 2 ) 2 (7V I +N 2 - 1) ~~ (3 + 2) 2 (3 + 2—1) “25 


OTRAS APLICACIONES DE LA PRUEBA DE LAS RACHAS 


17.22 Con los datos del problema 17.3 y empleando como nivel de significancia 0.05, determinar si las duraciones 
muéstrales de las baterías producidas por la empresa PQR son aleatorias. Suponer que las duraciones de las 
baterías dadas en la tabla 17.3 se registraron en forma consecutiva. Esto es, la primera duración fue 271, la 
segunda duración fue 230, y así sucesivamente hasta la última duración, 268. Resolver el problema primero a 
mano, dando todos los detalles de la prueba de las rachas para aleatoriedad. Después, resolver el problema 
empleando STATISTIX. 

SOLUCIÓN 


En la tabla 17.23 se muestran las duraciones de las baterías en orden creciente de magnitud. Como en esta tabla hay 24 
entradas, la mediana se obtiene de los dos valores de en medio, 253 y 262, y es i(253 + 262) = 257.5. Ahora se rescriben 
los datos de la tabla 17.3 sustituyéndolos por una a si su valor es mayor a la mediana y por una b si su valor es menor a la 
mediana; se obtiene la tabla 17.24, en la que hay 12 letras a, 12 letras ib y 15 rachas. Por lo tanto, A/j = 12, N 2 =12, N = 
24, y = 15, y se tiene 


Hv — 


2N\N 2 

TV, + TV 2 


2(12)( 12) 
12+12 


+ 1 = 13 


2 2(12)(12)(264) 

Oy — -T- — 

(24) 2 (23) 


de manera que 


V - /+- 
0> 


15- 13 
2.396 


0.835 


Tabla 17.23 


198 

211 

216 

219 

224 

225 

230 

236 

243 

252 

253 

253 

262 

264 

268 

271 

272 

275 

282 

284 

288 

291 

294 

295 


Tabla 17.24 

abbaabab 

bbaababb 

aabbabaa 
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Empleando una prueba de dos colas, al nivel de significancia 0.05, la hipótesis de aleatoriedad se acepta si -1.96 < z < 
1.96. Como 0.835 cae dentro de este intervalo, se concluye que la muestra es aleatoria. 

A continuación se presenta el análisis empleando STATISTIX . Las duraciones se ingresan en la columna 1 en el 
orden en que fueron obtenidas. A la columna se le da como título Durad o n es. Empleando la secuencia Statistics -» 
Randomness/Normality Tests —> RunsTest se obtiene el resultado que se presenta a continuación. 


Statistix 8.0 


Prueba de rachas para duración 


Median 257.50 

Valúes Above the Median 12 

Valúes below the Median 12 

Valúes Tied with the Median O 

Runs Above the Median 8 

Runs Below the Median 7 

Total Number of Runs 15 

Expected Number of Runs 13.0 


p-Value, Two-Tailed Test 0.5264 

Probability of getting 15 or fewer runs 0.8496 
Probability of getting 14 or more runs 0.2632 


El valor p grande indica que la cantidad de rachas puede ser considerada como aleatoria. 


17.23 Resolver el problema 17.5 empleando la prueba de las rachas para aleatoriedad. 

SOLUCIÓN 

En el primer renglón de la tabla 17.8 aparecen ya todos los valores de las dos muestras ordenados de menor a mayor. 
Empleando una a para cada dato de la muestra I y una ó para cada dato de la muestra II, el primer renglón de la tabla 17.8 
será 


bbbbbbbbaaaaabbaaa 
Como hay cuatro rachas, se tiene 1/ = 4, N 1 = 8 y N 2 = 10. Entonces, 


l¿v — 


2N\N 2 
N x + N 2 


2 ( 8 )( 10 ) 

18 


+ 1 = 9.889 


2N 1 N 2 (2N l N 2 -Ni - N 2 ) , 2(8) (10) (142) 
(Ni + N 2 ) 2 (N\ + N 2 — 1) (18) 2 ( 17) 


, V - /i v 4-9.889 

de manera que z = -—= — = -2.90 

a y 2.031 

Si H 0 es la hipótesis de que no hay diferencia entre las aleaciones, esto equivale a la hipótesis de que la secuencia anterior 
es aleatoria. Esta hipótesis se acepta si -1.96 < z < 1.96 y se rechaza si no es así. Como z = -2.90 se encuentra fuera de 
este intervalo, se rechaza H 0 y se llega a la misma conclusión que en el problema 17.5. 

Obsérvese que si se hace la corrección por continuidad, 

V-Hv (4+ 0.5)-9.889 

Z = ^^ =- 2MÍ - = " 2 ' 65 


y se llega a la misma conclusión. 
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CORRELACIÓN DE RANGOS 

17.24 Las calificaciones, en teoría y laboratorio, de una clase de biología que se presentan en la tabla 17.25 corres¬ 
ponden a 10 estudiantes colocados en orden alfabético. Encontrar el coeficiente de correlación de rangos. Usar 
SPSS para calcular la correlación de rangos de Spearman. 


Tabla 17.25 


Laboratorio 

8 

3 

9 2 

7 

10 4 

6 

1 

5 

Teoría 

9 

5 

10 1 

8 

7 3 

4 

2 

6 


SOLUCIÓN 

En la tabla 17.26 se presentan las diferencias, D, entre los rangos (calificaciones) de laboratorio y de teoría de cada estu¬ 
diante; se da también D 2 y E D 2 - Entonces 


6E A 2 , 6(24) 

N(N 2 — 1) 10(10 2 — 1) 


0.8545 


lo que indica que hay una estrecha relación entre las calificaciones de teoría y de laboratorio. 


Tabla 17.26 


D ¡ferencla entre los rangos (D) 

-1-2-11-13 1 2 -1 -1 


D 2 

14 11 19 14 11 

ED 2 = 24 


Los datos de la tabla 17.26 se ingresan en las col umnas tituladas Lab y Lee t u r e (Teoría). Con la secuencia A nalyze 
Correlate-» B¡varíate se obtienen los resultados siguientes. 


Correlaciones 




Lab 

Teoría 

Correlación de rangos 

Lab Coeficiente de correlación 

1.000 

.855 

de Spearman 

Sig. (2 colas) 


.002 


N 

10 

10 


Teoría Coeficiente de correlación 

.855 

1.000 


Sig. (2 colas) 

.002 



N 

10 

10 


El resultado indica que hay una correlación significativa entre los desempeños en teoría yenl aboratori o. 


17.25 En latabla 17.27 se muestran las estaturas de una muestra del2 padres y de sus hijos mayores adultos. Encontrar 
el coeficiente de correlación de rangos. Resolver el problema primero a mano, dando todos los detalles para 
hallar el coeficiente de correlación de rangos. Después, usar SAS para hallar la solución del problema. 
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Tabla 17.27 


Estatura del padre (pulgadas) 

65 

63 

67 

64 

68 

62 

70 

66 

68 

67 

69 

71 

Estatura del hijo (pulgadas) 

68 

66 

68 

65 

69 

66 

68 

65 

71 

67 

68 

70 


SOLUCIÓN 


En orden creciente de magnitud, las estaturas de los padres son 

62 63 64 65 66 67 67 68 68 69 71 (18) 

Como la sexta y séptima estaturas son iguales [67 pulgadas (in)], a estas posiciones se les asigna un rango medio ^(6 + 7) 
= 6.5. De igual manera, a las estaturas octava y novena se les asigna el rango 1(8 + 9) = 8.5. De esta manera, los rangos 
asignados a las estaturas de los padres son 

1 2 3 4 5 6.5 6.5 8.5 8.5 10 11 12 (19) 

En forma análoga, en orden creciente de magnitud, las estaturas de los hijos son 

65 65 66 66 67 68 68 68 68 69 70 71 (20) 

y como las estaturas sexta, séptima, octava y novena son ¡guales (68 in), a estos lugares se les asigna el rango medio ¿(6 + 

7 + 8 + 9) = 7.5. De esta manera, los rangos asignados a las estaturas de los hijos son 

1.5 1.5 3.5 3.5 5 7.5 7.5 7.5 7.5 10 11 12 (21) 

Empleando las correspondencias (18) y (19), y (20) y (21), la tabla 17.27 puede reemplazarse por la tabla 17.28. En 

la tabla 17.29 se dan las diferencias entre los rangos D, D 2 y E D 2 , con lo que 


6 E D 2 6(72.50) 

N{N 2 - 1) “ ~ 12(12 2 - 1) 


0.7465 


Tabla 17.28 


Rango del padre 

4 2 6.5 3 8.5 1 11 5 8.5 6.5 10 12 

Rango del hijo 

7.5 3.5 7.5 1.5 10 3.5 7.5 1.5 12 5 7.5 11 


Tabla 17.29 


D 

-3.5 -1.5 

-1.0 1.5 

-1.5 -2.5 3.5 

3.5 -3.5 

1.5 

2.5 

1.0 


D 2 

12.25 2.25 

1.00 2.25 

2.25 6.25 12.25 

12.25 12.25 

2.25 

6.25 

1.00 

ED 2 = 72.50 


Este resultado coincide con el coeficiente de correlación obtenido mediante otros métodos. 

Las estaturas de los padres se ingresan en la primera columna y las de los hijos en la segunda columna y se pulsa el 
comando de SAS. Con la secuencia Statistics -» Descriptive^ Correlations se obtienen los resultados siguientes. 


The CORR Procedure 
2 Variables: Fatherht Sonht 


Simple Statistics 


Variable 

N 

Mean 

Std Dev 

Median 

Minimum 

Máximum 

Fatherht 

12 

66.66667 

2.77434 

67.00000 

62.00000 

71.00000 

Sonht 

12 

67.58333 

1.88092 

68.00000 

65.00000 

71.00000 
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Spearman Correlation Coefficient, N = 12 
prob > | r | under HO: Rho = 0 


Fatherht 

Sonht 


Fatherht 

1.00000 

0.74026 


Sonht 

0.74026 

0.0059 

1.00000 

0.0059 


Además de los estadísticos sencillos, SAS da el coeficiente de correlación de Spearman, que es 0.74. El valor p, 
0.0059, puede emplearse para probar la hipótesis nula de que el coeficiente poblacional de correlación de rangos es igual a 
0 versus la hipótesis alternativa de que el coeficiente poblacional de correlación de rangos es diferente de 0. Se concluye 
que en la población sí existe una relación entre estaturas de los padres y estaturas de los hijos. 


PROBLEMAS SUPLEMENTARIOS 


LA PRUEBA DE LOSSIGNOS 

17.26 U na empresa asegura que si sus productos se adicionan al tanque de gasolina de los automóviles, su rendimiento, en millas 
por galón, aumenta. Para probar esto, se eligen 15 automóviles diferentes y se mide el rendimiento de la gasolina, en millas 
por galón, con el aditivo y sin éste; los resultados se muestran en la tabla 17.30. Suponiendo que las condiciones de mane¬ 
jo sean las mismas, determinar los niveles de significancia: a) 0.05 y b ) 0.01, si hay alguna diferencia atribuible al uso del 
aditivo. 


Tabla 17.30 


Con aditivo 

34.7 28.3 19.6 25.1 15.7 24.5 28.7 23.5 27.7 32.1 29.6 22.4 25.7 28.1 24.3 

Sin aditivo 

31.4 27.2 20.4 24.6 14.9 22.3 26.8 24.1 26.2 31.4 28.8 23.1 24.0 27.3 22.9 


17.27 ¿Se puede concluir, al nivel de significancia 0.05, que el rendimiento, en millas por galón, obtenido en el problema 17.26 
es mejor con aditivo que sin aditivo? 

17.28 U n club para bajar de peso anuncia un programa especial con el que se pierde por lo menos el 6% en 1 mes, si se sigue el 
programa al pie de la letra. Para probar si esto es así, 36 adultos se someten al programa. De éstos, 25 logran bajar la can¬ 
tidad deseada, 6 aumentan de peso y el resto permanece esencialmente igual. Al nivel de significancia 0.05, determinar si 
el programa es efectivo. 

17.29 U n capacitador asegura que si el personal de ventas de la empresa toma un curso especial, las ventas anuales de la empresa 
aumentarán. Para probar esto, 24 personas toman el curso. Las ventas de 16 de ellas aumentan, las ventas de 6 de ellas 
disminuyen y las de 2 de ellas permanecen Igual. Al nivel de significancia 0.05, probar la hipótesis de que el curso incre¬ 
menta las ventas de la empresa. 

17.30 La empresa refresquera M W realiza "pruebas de sabor" en 27 lugares en todo Estados U nidos, con objeto de determinar 
las preferencias del público respecto a dos marcas de cola, A y 6. En ocho lugares se prefirió la marca A a la marca 6, en 
17 lugares se prefirió la marca 6 a la marca A, y en el resto de los lugares fueron indiferentes. Al nivel de significancia 0.05, 
¿se puede concluir que la marca B se prefiere a la marca A? 

17.31 En la tabla 17.31 se muestra la resistencia a la ruptura de una muestra de 25 cuerdas fabricadas poruña empresa. Basándose 
en esta muestra, probar al nivel de significancia 0.05 la afirmación del fabricante de que la resistencia a la ruptura de las 
cuerdas es: a) 25, bj 30, c) 35 y d) 40. 
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Tabla 17.31 


41 

28 

35 

38 

23 

37 

32 

24 

46 

30 

25 

36 

22 

41 

37 

43 

27 

34 

27 

36 

42 

33 

28 

31 

24 


17.32 M ostrar cómo obtener límites de confianza de 95% para los datos del problema 17.4. 

17.33 Diseñe y resuelva un problema en el que se emplee la prueba de los signos. 

LA PRUEBA U DE MANN-WHITNEY 

17.34 Dos profesores, A y B, imparten un mismo curso en la universidad XYZ. En la tabla 17.32 se presentan las calificaciones 
que obtienen sus alumnos en el examen final, que es común para los dos grupos. AI nivel de significancia 0.05, probar la 
hipótesis deque no hay diferencia entre las calificaciones de los dos profesores. 


Tabla 17.32 


A 

88 

75 

92 

71 

63 

84 

55 

64 

82 

96 

B 

72 

65 

84 

53 

76 

80 

51 

60 

57 

85 94 87 73 61 


17.35 Volviendo al problema 17.34, al nivel de significancia 0.01, ¿puede concluirse que los alumnos del maestro 6 sean mejores 
que los alumnos del maestro Al 

17.36 U n agricultor quiere determinar si hay diferencia en el rendimiento de dos variedades de trigo, I y II. En la tabla 17.33 se 
muestra la producción de trigo por unidad de área con cada una de las dos variedades de trigo. A los niveles de significan¬ 
cia: a) 0.05 y b ) 0.01, ¿puede concluirse que existe alguna diferencia? 


Tabla 17.33 


Trigo 1 

15.9 

15.3 

16.4 

14.9 

15.3 

16.0 

14.6 

15.3 

14.5 16.6 16.0 

Trigo II 

16.4 

16.8 

17.1 

16.9 

18.0 

15.6 

18.1 

17.2 

15.4 


17.37 ¿Puede el agricultor del problema 17.36 concluir que con el trigo II se obtiene mayor rendimiento? 

17.38 Una empresa desea determinar si hay diferencia entre dos marcas de gasolina, A y 6. En la tabla 17.34 se muestran las 
distancias obtenidas por galón con cada una de las dos marcas. AI nivel de significancia 0.05, ¿puede concluirse: a) que sí 
hay diferencia entre las marcas y b ) que la marca B es mejor que la marca A? 


Tabla 17.34 


A 

30.4 

28.7 

29.2 

32.5 

31.7 

29.5 

30.8 

31.1 

30.7 

31.8 

B 

33.5 

29.8 

30.1 

31.4 

33.8 

30.9 

31.3 

29.6 

32.8 

33.0 


17.39 ¿Puede emplearse una prueba U para determinar si hay diferencia entre las máquinas I y II de la tabla 17.1? Explicar. 
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17.40 D iseñar y resolver un problema usando la prueba U. 

17.41 Dados los datos de la tabla 17.35, encontrar U usando: a) el método de la fórmula y b ) el método del conteo. 

17.42 Repetir el problema 17.41 con los datos de la tabla 17.36. 


17.43 U na población consta de los números 2, 5, 9 y 12. De esta población se toman dos muestras, la primera consta de uno de 
estos números y la segunda consta de los otros tres números. 

a) Obtener la distribución muestral de U y su gráfica. 

b ) Obtener la media y la varianza de esta distribución, tanto directamente como empleando la fórmula. 

17.44 Probarqueí7 1 + U 2 = A/ 1 A/ 2 . 

17.45 Probar queR 2 + R 2 = [A/(N + l)]/2 en el caso en que la cantidad de empates sea: a) 1, b) 2 y c) cualquier número. 

17.46 Si A/j = 14, /V 2 = 12 y R 1 = 105, encontrar: a) R 2 , b)U 1 yc) U 2 . 

17.47 Si N 1 = 10, N 2 = 16 y U 2 = 60, encontrar: a) R lt b) R 2 y c) U v 

17.48 ¿Cuál es la mayor cantidad de los valores N 1 ,N 2 ,R 1 ,R 2 ,U 1 y U 2 que se puede determinar a partir de los restantes? Probar 
la respuesta. 


Tabla 17.35 


M uestra 1 

15 25 

M uestra 2 

20 32 


Tabla 17.36 


M uestra 1 

40 27 30 56 

M uestra 2 

10 35 


LA PRUEBA H DE KRUSKAL-WALLIS 

17.49 Se hace un experimento para determinar el rendimiento de cinco variedades de trigo: 4,6, C, D y E. A cada variedad se le 
asignan cuatro parcelas. En la tabla 17.37 se presentan los rendimientos (en bushels por acre). Suponiendo que en todas las 
parcelas la fertilidad sea semejante y que las variedades se hayan asignado de manera aleatoria a las parcelas, determinar, 
a los niveles de significancia: a) 0.05 y b) 0.01, si hay diferencia significativa entre los rendimientos. 


Tabla 17.37 


A 

20 

12 

15 

19 

B 

17 

14 

12 

15 

C 

23 

16 

18 

14 

D 

15 

17 

20 

12 

E 

21 

14 

17 

18 


Tabla 17.38 


4 

33 

38 

36 

40 

31 

35 

B 

32 

40 

42 

38 

30 

34 

C 

31 

37 

35 

33 

34 

30 

D 

27 

33 

32 

29 

31 

28 


17.50 U na empresa desea probar cuatro tipos diferentes de neumáticos: 4,6,CyD.Enla tabla 17.38 se dan las duraciones de 
los neumáticos (en miles de millas) determinadas de acuerdo con su dibujo: cada tipo de neumático se probó en seis auto¬ 
móviles similares asignados aleatoriamente a los neumáticos. A los niveles: a) 0.05 y b ) 0.01, determinar si hay diferencia 
significativa entre los neumáticos. 
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17.51 Un maestro desea probar tres métodos de enseñanza: I, II y III. Para esto, elige en forma aleatoria tres grupos de cinco 
estudiantes cada uno y en cada grupo prueba uno de los métodos de enseñanza. A todos los estudiantes les pone el mismo 
examen. En la tabla 17.39 se presentan las calificaciones obtenidas. A los niveles de significancia: a) 0.05 y b) 0.01, deter¬ 
minar si hay diferencia entre estos métodos de enseñanza. 


Tabla 17.39 


M étodo 1 

78 

62 

71 

58 

73 

M étodo 11 

76 

85 

77 

90 

87 

M étodo III 

74 

79 

60 

75 

80 


17.52 En la tabla 17.40 se presentan las calificaciones obtenidas por un estudiante durante un semestre en varias materias. A los 
niveles de significancia: a) 0.05 y b) 0.01, probar si hay diferencia entre las calificaciones en estas materias. 


Tabla 17.40 


M atemáticas 

72 

80 

83 

75 

Ciencias 

81 

74 

77 


Inglés 

88 

82 

90 

87 80 

Economía 

74 

71 

77 

70 


17.53 U sando la prueba H , resolver: a) el problema 16.9, b) el problema 16.21 y c) el problema 16.22. 

17.54 Usando la prueba H, resolver: a) el problema 16.23, b) el problema 16.24 y c) el problema 16.25. 

PRUEBA DE LAS RACHAS PARA ALEATORIEDAD 

17.55 En cada una de estas secuencias, determinar la cantidad, l/, de rachas. 

a) ABABBAAABBAB 

b ) HHTHHHTTTTHHTHHTHT 

17.56 A 25 personas se les preguntó si les gustaba un producto (lo que se Indica por Y y N, respectivamente). El resultado mues- 
tral obtenido es el que se presenta en la secuencia siguiente: 

YYNNNNYYYNYNNYNNNNNYYYYNN 

a) Determinar la cantidad, l/, de rachas. 

b) AI nivel de significancia 0.05, probar si estas respuestas son aleatorias. 

17.57 Aplicar la prueba de las rachas a las secuencias (10) y (11) de este capítulo y dar las conclusiones acerca de la aleatorle- 
dad. 

17.58 a) Formar todas las secuencias posibles que contengan dos letras a y una letra b y dar el número 1/ de rachas correspon¬ 

diente a cada secuencia. 

b) Obtener la distribución muestral de V, así como su gráfica. 

c) Obtener la distribución de probabilidad de V, así como su gráfica. 
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17.59 En el problema 17.58, encontrar la media y la varlanza de \/: a) directamente a partir de la distribución muestral y 
b ) mediante las fórmulas. 

17.60 Resolver los problemas 17.58 y 17.59, pero esta vez con: a) dos letras a y dos letras ó; b) una letra a y tres letras ó, y c) una 
letra a y cuatro letras b. 

17.61 Resolver los problemas 17.58 y 17.59, pero esta vez con dos letras a y cuatro letras b. 

OTRASAPLICACIONESDE LA PRUEBA DE LAS RACHAS 

17.62 Empleando como nivel de significancia 0.05, determinar si la muestra de las 40 calificaciones de la tabla 17.5 es aleato¬ 
ria. 

17.63 En la tabla 17.41 se da el precio de cierre de una acción en 25 días consecutivos. AI nivel de significancia 0.05, determinar 
si estos precios son aleatorios. 


Tabla 17.41 


10.375 

11.125 

10.875 

10.625 

11.500 

11.625 

11.250 

11.375 

10.750 

11.000 

10.875 

10.750 

11.500 

11.250 

12.125 

11.875 

11.375 

11.875 

11.125 

11.750 

11.375 

12.125 

11.750 

11.500 

12.250 


17.64 Los primeros dígitos de V2 son 1.41421 35623 73095 0488- ■ ■. ¿Qué conclusión se puede sacar respecto a la aleatoriedad 
de estos dígitos? 

17.65 ¿Qué conclusión se puede sacar respecto a la aleatoriedad de los dígitos siguientes? 

a) v / 3 = 1.73205 08075 68877 2935- 

b) tt = 3.14159 26535 89793 2643- 

17.66 En el problema 17.62, mostrar que empleando la aproximación normal, el valor p es 0.105. 

17.67 En el problema 17.63, mostrar que empleando la aproximación normal, el valor p es 0.168. 

17.68 En el problema 17.64, mostrar que empleando la aproximación normal, el valor p es 0.485. 

CORRELACIÓN DE RANGOS 

17.69 En un concurso se pide a los jueces que ordenen a los candidatos (numerados del 1 al 8) de acuerdo con su preferencia. Los 
resultados se muestran en la tabla 17.42. 

a) Encontrar el coeficiente de correlación de rangos. 

b) Decidir si hay buena coincidencia entre los jueces. 


Tabla 17.42 


Primer juez 

5 2 8 1 4 6 3 7 

Segundo juez 

4 5 7 3 2 8 1 6 
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17.70 La tabla 14.17, que se reproduce a continuación, da los índices de precios al consumidor, en Estados U nidos, para alimen¬ 
tos y atención médica desde 2000 hasta 2006, comparados con los precios de los años base, 1982 a 1984 (tomando la media 
como 100). 


Año 

2000 

2001 

2002 

2003 

2004 

2005 

2006 

Alimentos 

167.8 

173.1 

176.2 

180.0 

186.2 

190.7 

195.2 

M edlclna 

260.8 

272.8 

285.6 

297.1 

310.1 

323.2 

336.2 


F uente: B ureau of L abor Statistics. 


Según estos datos, encontrar la correlación de rangos de Spearman y el coeficiente de correlación de Pearson. 

17.71 El coeficiente de correlación de rangos se obtiene empleando los datos ordenados por rangos en la fórmula del producto- 
momento del capítulo 14. Ilustrar esto empleando ambos métodos para resolver un problema. 

17.72 Para datos agrupados, ¿puede obtenerse el coeficiente de correlación de rangos? Explicar e ¡lustrar la respuesta con un 
ejemplo. 





Control estadístico 

DE PROCESOS Y 
CAPACIDAD DE 
PROCESOS 



ANÁLISIS GENERAL DE LAS GRÁFICAS DE CONTROL 

Las variaciones que se presentan en cualquier proceso pueden deberse a causas comunes o a causas especiales. La 
variación natural de materiales, maquinaria y personas da lugar a las causas comunes de variación. Las causas espe¬ 
ciales, también conocidas como causas asignables, se deben en la industria a desgaste excesivo délas herramientas, a 
un nuevo operador, a cambios en los materiales, a nuevos proveedores, etc. Uno de los propósitos de las gráficas de 
control es localizar, y si es posible, eliminar las causas especiales de variación. La estructura general de una gráfica 
de control consta de límites de control y de una línea central, como se muestra en la figura 18 - 1 . Hay dos límites de 
control, el límite superior de control o UCL (por sus siglas en inglés) y el límite inferior de control o LCL (por sus 
siglas en inglés). 


Causas especiales 


UCL 


Causas comunes 


Línea central 


Causas comunes 


LCL 


Causas especiales 

- 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 

Tiempo 

F ¡gura 18-1 L as gráficas de control pueden ser de dos tipos (gráficas de control 
para variables y gráficas de control para atributos). 
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Cuando en una gráfica de control un punto cae fuera de los límites de control, se dice que el proceso está fuera de 
control estadístico. Además de los puntos fuera de control, hay otras anomalías que Indican que un proceso está fuera 
de control. Éstas se verán más adelante. Lo deseable es que los procesos estén bajo control, de manera que su compor¬ 
tamiento sea previsible. 


GRÁFICAS DE CONTROL DE VARIABLES Y GRÁFICAS 
DE CONTROL DE ATRIBUTOS 

Las gráficas de control se pueden dividir en gráficas de control de variables y gráficas de control de atributos. Los 
términos "variable" y "atributo" se deben al tipo de datos que se recolectan del proceso. SI se miden características 
como tiempo, peso, volumen, longitud, caída depresión, concentración, etc., los datos obtenidos se consideran conti¬ 
nuos y se conocen como datos de variables. SI se cuenta la cantidad de defectuosos en una muestra o la cantidad de 
defectos en determinado tipo de artículo, a los datos obtenidos se les llama datos de atributos. Se considera que los 
datos de variables son de nivel superior a los datos de atributos. En la tabla 18.1 sedan los nombres de algunas gráfi¬ 
cas de control de variables y de control de atributos, así como los estadísticos que en ellas se grafican. 


Tabla 18.1 


Tipo de gráfica 

Estadístico que se gráfica 

Gráfica X-barra y gráfica R 

Promedios y rangos de subgrupos de datos de las variables 

Gráfica X-barra y gráfica slgma 

Promedios y desviaciones estándar de subgrupos de datos de las variables 

Gráfica mediana 

M ediana de subgrupos de datos de las variables 

Gráficas de lecturas Individuales 

M ediciones Individuales 

Gráfica cusum 

Suma acumulada de cada X menos el valor nominal 

Gráfica de zonas 

Pesos por zonas 

Gráfica EWM A 

M edias móviles con pesos exponenciales 

Gráfica P 

Proporción de artículos defectuosos en el total inspeccionado 

Gráfica NP 

Cantidad real de artículos defectuosos 

Gráfica C 

Cantidad de defectos por artículo en muestras de tamaño constante 

Gráfica U 

Cantidad de defectos por artículo en muestras de tamaño variable 


En la tabla 18.1, las gráficas arriba de la línea punteada son gráficas de control de variables y las gráficas debajo 
déla línea punteada son gráficas de control de atributos. Actualmente, para la elaboración de gráficas suele emplearse 
algún software para estadística, como M IIMITA B. 


GRÁFICASX-BARRAY GRÁFICAS/? 

Para entender la ¡dea general de una gráfica X-barra considérese un proceso que tenga media y desviación estándar 
cr. Supóngase que el proceso se vigila tomando periódicamente muestras, a las que se les llama subgrupos de tamaño 
n, y calculando la media muestral X de cada una de ellas. El teorema del límite central asegura que la media de las 
medias muéstrales es yt y la desviación estándar de las medias muéstrales es u/y/ñ. La línea central de las medias 
muéstrales se designa como y¿ y se considera que los límites inferior y superior de control están 3(a/^ñ) abajo y arri¬ 
ba de la línea central. El límite Inferior de control está dado por la ecuación (1): 

LCL = — 3(cr/v / ») 


( 1 ) 
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El límite superior de control está dado por la ecuación (2): 

UCL=^ + 3 (a/y/n) (2) 

En un proceso distribuido normalmente, la media de un subgrupo caerá 99.7% délas veces éntrelos límites dados por 
(1) y (2). En la práctica no se conoce ni la media ni la desviación estándar del proceso y es necesario estimarlas. La 
media del proceso se estima mediante la media de las medias de las muestras periódicas. Esta media está dada por la 
ecuación (3), donde m es la cantidad de muestras de tamaño n tomadas periódicamente. 

F = ^ (3) 

m 

La media X, también puede encontrarse sumando todos los datos y dividiendo esta suma entre mn. La desviación 
estándar del proceso se estima promediando las desviaciones estándar o los rangos de los subgrupos, o bien usando un 
valor histórico de a. 


EJEMPLO 1 Se obtienen datos sobre la anchura de un producto. En 20 periodos se toman 5 observaciones de cada periodo. Los 
datos obtenidos se presentan en la tabla 18.2. El número de muestras periódicas es m = 20, el tamaño de la muestra o subgrupo es 
n = 5, la suma de todos los datos es 199.84 y la línea central es X = 1.998. La secuencia del menú de M INITAB "Stat => Control 
charts =>Xbar" se utilizó para procesar la gráfica de control que se muestra en la figura 18-2. Los datos de la tabla 18.2 se ingre¬ 
san en una sola columna antes de aplicar la secuencia del menú anterior. 


Tabla 18.2 


1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

2.000 

2.007 

1.987 

1.989 

1.997 

1.983 

1.966 

2.004 

2.009 

1.991 

1.988 

1.988 

1.983 

1.989 

2.018 

1.972 

1.982 

1.998 

1.994 

1.989 

1.975 

2.002 

2.006 

1.997 

1.999 

2.002 

1.995 

2.011 

2.020 

2.000 

1.994 

1.978 

2.019 

1.976 

1.990 

1.991 

2.020 

1.991 

2.000 

2.016 

1.991 

2.012 

2.021 

2.007 

2.003 

1.997 

2.008 

1.972 

2.006 

2.037 


11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

2.004 

1.988 

1.996 

1.999 

2.018 

1.986 

2.002 

1.988 

2.011 

1.998 

1.980 

1.991 

2.005 

1.984 

2.009 

2.010 

1.969 

2.031 

1.976 

2.003 

1,998 

2.003 

1.996 

1.988 

2.023 

2.012 

2.018 

1.978 

1.998 

2.016 

1.994 

1.997 

2.008 

2.011 

2.010 

2.013 

1.984 

1.987 

2.023 

1.996 

2.006 

1.985 

2.007 

2.005 

1.993 

1.988 

1.990 

1.990 

1.998 

2.009 


La desviación estándar del producto puede estimarse de cuatro maneras distintas: sacando el promedio de los ran¬ 
gos de los 20 subgrupos, sacando el promedio de las desviaciones estándar de los 20 subgrupos, conjuntando las 
varianzas de los 20 subgrupos o mediante un valor histórico de a, en caso de que se conozca alguno. M l NITA B per¬ 
mite utilizar cualquiera de las cuatro opciones. En la figura 18-2 se grafican las 20 medias de las muestras que se 
presentan en la tabla 18.2. Esta gráfica indica que el proceso está bajo control. Las medias varían aleatoriamente res¬ 
pecto a la línea central y ninguna cae fuera de los límites de control. 
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Muestra 


UCL = 2.01729 


X = 1.99842 


LCL = 1.97955 


Figura 18-2 Gráfica X-barra para las anchuras. 


Las gráficas R se usan para vigilar la variación del proceso. Para cada uno de los m subgrupos se calcula el rango 
R. La línea central de la gráfica R está dada por la ecuación (4) 

R = ^ (4) 

m 

Como en el caso de la gráfica X-barra, hay diversos métodos para estimar la desviación estándar del proceso. 


EJEMPLO 2 Dados los datos de la tabla 18.2, el rango del primer subgrupo esR 1 = 2.000 - 1.975 = 0.025, el rango del segun¬ 
do subgrupo es R 2 = 2.012 - 1.978 = 0.034. Los 20 rangos son: 0.025, 0.034, 0.038, 0.031, 0.028, 0.030, 0.054, 0.039, 0.026, 
0.048, 0.026, 0.018, 0.012, 0.027, 0.030, 0.027, 0.049, 0.053, 0.047 y 0.020. La media de estos 20 rangos es 0.0327. En la figura 
18-3 se presenta una gráfica de estos rangos elaborada con M INITAB. Esta gráfica R no muestra patrón inusual alguno respecto de 
la variabilidad. Para obtener la gráfica de control de la figura 18-3 se emplea la secuencia "Stat -» Control charts -> R chart" 
de M IN ITAB. Antes de aplicar esta secuencia, los datos de la tabla 18.2 deben ingresarse en una sola columna. 



UCL = 0.06917 


R =0.03271 


LCL = O 


Muestra 

Figura 18-3 Gráfica R para las anchuras. 
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PRUEBAS PARA CAUSAS ESPECIAL ES 

A demás de un punto que caiga fuera délos límites de control, hay otros Indicadores que sugieren falta de aleatoriedad 
en un proceso debida a causas especiales. En la tabla 18.3 se presentan ocho pruebas para causas especiales. 


Tabla 18.3 Pruebas para causas especiales 


1. U n punto a más de 3 slgmas de la línea central 

2. Nueve puntos consecutivos de un mismo lado de la línea central 

3. Seis puntos consecutivos, crecientes o decrecientes 

4. Catorce puntos consecutivos, alternados arriba y abajo 

5. Dos de tres puntos a más de 2 slgmas de la línea central (de un mismo lado) 

6. Cuatro de cinco puntos a más de 1 slgma de la línea central (de un mismo lado) 

7. Quince puntos consecutivos a más de 1 slgma de la línea central (de cualquier lado) 

8. Ocho puntos consecutivos a más de 1 slgma de la línea central (de cualquier lado) 


CAPACIDAD DE PROCESOS 

Para llevar a cabo un análisis de la capacidad de un proceso, el proceso debe estar bajo control estadístico. Normalmente 
se supone que las características del proceso que van a ser medidas tienen distribución normal. Esto se puede compro¬ 
bar empleando pruebas de normalidad, como la prueba de Kolmogorov-Smlrnov, la prueba de Ryan-J omero la prueba 
deAnderson-DarlIng. La capacidad del proceso es una comparación entre el desempeño del proceso y los requerimien¬ 
tos del mismo. Los requerimientos del proceso determinan los límites de especificación. El LSL y el USL (por sus 
siglas en Inglés) son, respectivamente, el límite inferior de especificación y el límite superior de especificación. 

Los datos utilizados para determinar si un proceso está bajo control estadístico pueden emplearse para hacer el 
análisis de capacidad. A la distancia de 3 slgmas a ambos lados de la media se le conoce como dispersión del proceso. 
La media y la desviación estándar de las características del proceso suelen estimarse a partir de los datos obtenidos 
para el estudio del control estadístico del proceso. 


EJEMPLO 3 Como se vio en el ejemplo 2, los datos de la tabla 18.2 provienen de un proceso que está bajo control estadístico. 
Se encuentra que la estimación de la media del proceso es 1.9984. Y la desviación estándar de las 100 observaciones es 0.013931. 
Supóngase que los límites de especificación son LSL = 1.970 y USL = 2.030. La prueba de Kolmogorov-Smirnov para normalidad 
se aplica usando M INITAB y se encuentra que no se puede rechazar la normalidad de la característica del proceso. Las tasas de no 
conformes se calculan como sigue. La proporción arriba del USL = P(X > 2.030) = P[(X - 1.9984)/0.013931 > (2.030 - 
1.9984)/0.013931] = P(Z > 2.27) = 0.0116. Es decir, hay 0.0116(1 000 000) = 11 600 partes por millón (ppm) superiores al USL 
que son no conformes. Obsérvese que P(Z > 2.27) puede encontrarse usando M INITAB, en lugar de buscar en las tablas de distri¬ 
bución normal estándar. Esto se hace como sigue. Se emplea la secuencia Cale —> Probability Distribution —> Normal. 

ConX = 2.27 se obtiene 


x p(x <= x) 

2.2700 0.9884 

Se tiene P (Z < 2.27) = 0.9884, por lo tanto, P (Z > 2.27) = 1 - 0.09884 = 0.0116. 

De igual manera, la proporción abajo del LSL = P(X < 1.970) = P(Z < -2.04) = 0.0207. Hay 20 700 ppm abajo del LSL que 
son no conformes. También aquí se emplea M IN ITAB para hallar el área bajo la curva normal estándar a la izquierda de -2.04. 

La cantidad total de unidades no conformes es 11 600 + 20 700 = 32 300 ppm. Esto es, claramente, un número inaceptable¬ 
mente elevado de unidades no conformes. 
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Supóngase que p es la estimación de la media de la característica del proceso y a es la estimación de la desviación 
estándar de la característica del proceso, entonces la tasa de no conformes se estima como sigue. La proporción arriba 
del USL es igual a 


p{x > usl ) = p(^z > US] : ^ 


y la proporción abajo del LSL es igual a 


P{X < LSL) = p(z < LSL ^ ^ 

El índice de capacidad del proceso mide el potencial del proceso para satisfacer las especificaciones y se define 
como sigue: 


dispersión permitida USL — LSL 
dispersión medida 6 <7 


(5) 


EJEMPLO 4 Dados los datos del proceso de la tabla 18.2, U SL - L SL = 2.030 - 1.970 = 0.060,6d = 6(0.013931) = 0.083586 
y C p = 0.060/0.083586 = 0.72. 


El índice C PK mide el desempeño del proceso y se define como sigue: 


C 


PK 


= mínimo 


[ USL-p 
\ 3(7 


p-LSL{ 
3& J 


( 6 ) 


EJEMPLO 5 Dados los datos del proceso del ejemplo 1, 


C PK = mínimo 


f 2.030 — 1.9984 
\ 3(0.013931) ’ 


1.9984- 1.970] 
3(0.013931) J 


mínimo {0.76, 0.68} = 0.68 


En procesos que únicamente tienen límite Inferior de especificación, el índice inferior de capacidad C PL se define 
como sigue: 


p — LSL 
3(7 


(7) 


En procesos que únicamente tienen límite superior de especificación, el índice superior de capacidad C PU se defi¬ 
ne como sigue: 


„ USL - p 
Cpu “^^ 

El C PK se puede definir en términos del C PL y del C PU como sigue: 

Crk = mín {C PL , C PU } 

La relación entre tasas de no conformes y C PL y C PU se obtiene como sigue: 

P(X < LSL) = P^Z < LSL & = P{Z < — 3C pl ) dado que - 3C PL = LS ^ ^ 
P{X > USL) = p(^Z > US] :~ ^ = P{Z > 3C PU ) dado que3C PU = USI t~* :i 


( 8 ) 

( 9 ) 
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EJEMPLO 6 Supóngase que C PL = 1.1, entonces la proporción de no conformes es P[Z < -3(1.1)) = P(Z < -3.3). Esto se 
puede encontrar usando M INITAB, de la manera siguiente. Se da la secuencia "Cale => Probability Distribution => Normal". 

El área acumulada a la izquierda de -3.3 está dada como: 


Función de distribución acumulada 

Normal with mean = 0 and standard deviation = 1 
x P (X <= x) 

-3.3 0.00048348 

Habrá 1 000 000 x 0.00048348 = 483 ppm de no conformes. Empleando esta técnica se puede elaborar una tabla en la que se 
relacione la tasa de no conformes con el índice de capacidad. Esto se da en la tabla 18.4. 


Tabla 18.4 


Cpi 0 Cpu 

Proporción de no conformes 

ppm 

0.1 

0.38208867 

382089 

0.2 

0.27425308 

274253 

0.3 

0.18406010 

184060 

0.4 

0.11506974 

115070 

0.5 

0.06680723 

66807 

0.6 

0.03593027 

35930 

0.7 

0.01786436 

17864 

0.8 

0.00819753 

8198 

0.9 

0.00346702 

3467 

1.0 

0.00134997 

1350 

1.1 

0.00048348 

483 

1.2 

0.00015915 

159 

1.3 

0.00004812 

48 

1.4 

0.00001335 

13 

1.5 

0.00000340 

3 

1.6 

0.00000079 

1 

1.7 

0.00000017 

0 

1.8 

0.00000003 

0 

1.9 

0.00000001 

0 

2.0 

0.00000000 

0 


EJEMPLO 7 Usando la siguiente secuencia de M IN ITAB Stat=> Quality tools=> CapabilltyAnalysIs (Normal) se obtiene un 
análisis de capacidad de los datos de la tabla 18.2. Estos resultados de M IN ITAB se muestran en la figura 18-4. En estos resultados 
se dan las tasas de no conformes, los índices de capacidad y algunas otras medidas. Las cantidades halladas en los ejemplos 3, 4 y 
5 se acercan mucho a las medidas correspondientes mostradas en la figura. Las diferencias se deben a errores de redondeo, así como 
a diferentes métodos para estimar ciertos parámetros. La gráfica es muy ilustrativa, y señala la distribución de las mediciones mués¬ 
trales en un histograma. La distribución poblacional de las mediciones del proceso aparece como una curva normal. Las áreas, a la 
derecha del USL y a la izquierda del LSL, en las colas bajo la curva normal, representan el porcentaje de productos no conformes. 
M ultiplicando la suma de estos porcentajes por un millón, se obtiene la tasa, en ppm, de no conformes en el proceso. 
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Capacidad de anchura dd proceso 

LSL USL 


Datos del proceso 

LSL 

1.97000 

Objetivo 

* 

USL 

2.03000 

Media de la muestra 

1.99842 

Muestra N 

100 

DesvEst (dentro) 

0.01406 

DesvEst (total) 

0.01397 



1.97 1.98 1.99 2.00 2.01 2.02 2.03 


-Dentro 

-Total 


Capacidad potencial (dentro) 
Cp 0.71 
CPL 0.67 
CPU 0.75 
Cpk 0.67 
CCpk 0.71 

Capacidad total 

Pp 0.72 
PPL 0.68 
PPU 0.75 
Ppk 0.68 
Cpm * 


Logros observados 
PPM < LSL 20 000.00 
PPM > USL 20 000.00 
PPM Total 40 000.00 


Logros en exp. 

PPM < LSL 21 647.20 
PPM >USL 12 366.21 
PPM Total 34013.41 


Logros en exp. total 
PPM < LSL 20 933.07 
PPM > USL 11 876.48 
PPM Total 32 809.56 


Figura 18-4 Varias medidas de la capacidad del proceso. 


GRÁFICAS? Y NP 

C uando se categorizan o clasifican artículos producidos en masa, a los datos resultantes se les llama datos de atributos. 
Una vez establecidos los estándares que debe satisfacer un producto, se determinan las especificaciones. A un artículo 
que no satisface las especificaciones se le llama artículo no conforme. A un artículo que es no conforme y que no sirve 
para ser usado se leí lama artículo defectuoso. Resulta más grave que un artículo sea defectuoso a quesea no conforme. 
Un artículo puede ser no conforme debido a un rayón o una decoloración, sin quesea un artículo defectuoso. Que un 
artículo no satisfaga una prueba de desempeño posiblemente hará que el producto sea clasificado como defectuoso y 
como no conforme. A los defectos encontrados en un artículo se les llama no conformidades. A las fallas Irreparables 
se les llama defectos. 

Para los datos de atributo se pueden emplear cuatro gráficas de control distintas. Estas cuatro gráficas son las grá- 
ficasP, las/VP, lasC y las L/. Las gráficasP y las A/P se basan en la distribución blnomlal y las gráficasC y U se basan 
en la distribución de Polsson. Las gráficas P se usan para vigilar la proporción de artículos no conformes producidos 
en un proceso. En el ejemplo 8 se ¡lustran las gráficas P, así como la notación que se emplea para describirlas. 


EJEMPLO 8 Supóngase que cada 30 minutos se examinan 20 mascarillas para respiración y que por cada turno de 8 h se regis¬ 
tra la cantidad de unidades defectuosas. La cantidad total examinada durante un turno es igual a n = 20(16) = 320. En la tabla 18.5 
se dan los resultados obtenidos en 30 turnos. La línea central de la gráfica P corresponde a la proporción de defectuosos en los 30 
turnos, y está dada por la cantidad total de defectuosos entre el total de examinados en los 30 turnos, es decir 


p = 72/9 600 = 0.0075 

La desviación estándar de la distribución binomial, correspondiente a esta gráfica, es 


m-p) 


0.0075 x 0.9925 


320 


0.004823 


Los límites de control de 3 sigmas para este proceso son 
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Tabla 18.5 


Turno # 

Cantidad de 
defectuosos 

*/ 

Proporción de 
defectuosos 

P i = X/n 

Turno # 

Cantidad de 
defectuosos 

x, 

Proporción de 
defectuosos 

Pi = X/n 

1 

1 

0.003125 

16 

2 

0.006250 

2 

2 

0.006250 

17 

0 

0.000000 

3 

2 

0.006250 

18 

4 

0.012500 

4 

0 

0.000000 

19 

1 

0.003125 

5 

4 

0.012500 

20 

7 

0.021875 

6 

4 

0.012500 

21 

4 

0.012500 

7 

4 

0.012500 

22 

1 

0.003125 

8 

6 

0.018750 

23 

0 

0.000000 

9 

4 

0.012500 

24 

4 

0.012500 

10 

0 

0.000000 

25 

4 

0.012500 

11 

0 

0.000000 

26 

3 

0.009375 

12 

0 

0.000000 

27 

2 

0.006250 

13 

1 

0.003125 

28 

0 

0.000000 

14 

0 

0.000000 

29 

0 

0.000000 

15 

7 

0.021875 

30 

5 

0.015625 


f±3v Mp UO) 

El límite inferior de control es LCL = 0.0075 - 3(0.004823) = -0.006969. Cuando el LCL es negativo, se considera igual a 
cero, ya que la proporción de defectuosos en una muestra no es posible que sea negativa. El límite superior de control es UCL = 
0.0075 + 3(0.004823) = 0.021969. 

La gráfica P de este proceso, empleando M INITAB, se obtiene con la secuencia Stat —> Control charts -> P. En la figura 
18-5 se muestra la gráfica P. Aunque al parecer las muestras 15 y 20 Indican la presencia de una causa especial, cuando se compa¬ 
ra la proporción de defectuosos en estas muestras 15 y 20 (ambas igual a 0.021875) con el UCL = 0.021969, se ve que estos puntos 
no están más allá del UCL. 



3 6 9 12 15 18 21 24 27 30 


Muestra 

Figura 18-5 Con la gráfica p se vigila la proporción de defectuosos. 
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Con las gráficas NP se vigila el número de defectuosos, en lugar de la proporción de defectuosos. La gráfica NP 
es preferida por muchos debido a que es más fácil de entender que la proporción de defectuosos, tanto para los técnicos 
de calidad como para los operadores. La línea central en la gráfica NP está dada por np y los límites de control de 3 
sigmas son 


np ± 3 \Jnp(l -p) 


( 11 ) 


EJEMPLO 9 Dados los datos de la tabla 18.5, la línea central está dada por np = 320(.0075) = 2.4 y los límites de control son 
LCL = 2.4 - 4.63 = -2.23, que se toma Igual a0yUCL = 2.4 + 4.63 = 7.03. Si en un turno se encuentran 8 o más defectuosos, 
el proceso estará fuera de control. Con M INITAB, la solución se encuentra usando la secuencia 


Stat —> C ontrol charts —> NP 



UCL = 7.030 


NP = 2.4 


LCL = 0 


Muestra 

Figura 18-6 Con la gráfica NP se vigila el número de defectuosos. 


A ntes de ejecutar esta secuencia, el número de defectuosos por muestra debe ser Ingresado en alguna columna de la hoja de 
cálculo. En la figura 18-6 se muestra una gráfica N P. 


OTRASGRÁFICAS DE CONTROL 

Este capítulo es sólo una introducción al uso de las gráficas de control como ayuda en el proceso de control estadísti¬ 
co. En la tabla 18.1 se enumeran varias de las muchas gráficas de control que se emplean actualmente en la Industria. 
Para facilitar los cálculos, en las plantas de producción suele usársela gráfica mediana. En lugar délas medias de las 
muestras se grafican las medianas de las muestras. SI el tamaño de la muestra es non, entonces la mediana es simple¬ 
mente el valor de en medio en el conjunto de valores ordenados de menor a mayor. 

Cuando el volumen de producción es pequeño suelen emplearse las gráficas de lecturas individuales. En este caso, 
el subgrupo o muestra consta de una sola observación. A las gráficas de lecturas Individuales también se les llama 
gráficasX. 

U na gráfica de zonas está dividida en cuatro zonas. La zona 1 son los valores a no más de 1 desviación estándar 
de la media, la zona 2 son los valores entre 1 y 2 desviaciones estándar de la media, la zona 3 son los valores entre 2 
y 3 desviaciones estándar de la media, y la zona 4 son los valores a 3 o más desviaciones estándar de la media. A las 
cuatro zonas se les asignan pesos. Los pesos de los puntos a un mismo lado de la línea central se suman y si la suma 
acumulada es mayor o Igual al peso asignado a la zona 4, esto se considera como una señal de que el proceso está fuera 
de control. La suma acumulada se hace Igual a cero después de que el proceso se ha considerado fuera de control, o 
cuando el siguiente punto graficado cruza la línea central. 
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Las gráficas de medias móviles con pesos exponenciales (gráfica EWMA, por sus siglas en inglés) son una alter¬ 
nativa a las gráficas de lecturas individuales o a las gráficasX-barra y proporcionan una rápida respuesta a cualquier 
desplazamiento del promedio del proceso. En las gráficas EWMA se incorpora información de todos los subgrupos 
anteriores, no sólo del subgrupo presente. 

Las sumas acumuladas de las desviaciones del valor objetivo del proceso se utilizan en las gráficas cusum. Tanto 
las gráficas EWM A como las gráficas cusum permiten detectar fácil mente cualquier desplazamiento del proceso. 

Cuando lo que interesa es la cantidad de no conformidades o de defectos en un producto y no simplemente deter¬ 
minar si el producto está defectuoso o no, se usan las gráficas C o las gráficas U . Cuando se usan estas gráficas es 
importante definir una unidad de inspección. La unidad de inspección se define como la unidad de producción a ser 
muestreada y examinada respecto de no conformidades. Si sólo hay una unidad de inspección por muestra, se usa una 
gráfica C, y si el número de unidades de inspección por muestra varía, se usa una gráfica ti. 


PROBLEMAS RESUELTOS 
GRÁFICAS X-BARRA Y GRÁFICAS R 

18.1 En un proceso industrial se llenan paquetes de avena para desayuno. La media de llenado de este proceso es 
510 gramos (g) y la desviación estándar del llenado es 5 g. Cada hora se toman cuatro paquetes y el peso medio 
del subgrupo de cuatro pesos se emplea para vigilar el proceso respecto a causas especiales y para ayudar a 
mantener el proceso bajo control estadístico. Hallar los límites inferior y superior de control de la gráfica de 
control X-barra. 

SOLUCIÓN 

En este problema se supone que se conocen ¿u y a y que son iguales a 510 y 5, respectivamente. Cuando no se conocen ni 
/i ni a, será necesario estimarlas. El límite inferior de control es LCL = n - 3(a/y/r¡) = 510 - 3(2.5) = 502.5 y el límite 
superior de control es UCL = fj, + 3 (a/^ñ) = 510 + 3(2.5) = 517.5. 


Tabla 18.6 


Periodo 

Periodo 

Periodo 

Periodo 

Periodo 

Periodo 

Periodo 

Periodo 

Periodo 

Periodo 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

2.000 

2.007 

1.987 

1.989 

1.997 

1.983 

1.966 

2.004 

2.009 

1.991 

1.988 

1.988 

1.983 

1.989 

2.018 

1.972 

1.982 

1.998 

1.994 

1.989 

1.975 

2.002 

2.006 

1.997 

1.999 

2.002 

1.995 

2.011 

2.020 

2.000 

1.994 

1.978 

2.019 

1.976 

1.990 

1.991 

2.020 

1.991 

2.000 

2.016 

1.991 

2.012 

2.021 

2.007 

2.003 

1.997 

2.008 

1.972 

2.006 

2.037 


Periodo 

11 

Periodo 

12 

Periodo 

13 

Periodo 

14 

Periodo 

15 

Periodo 

16 

Periodo 

17 

Periodo 

18 

Periodo 

19 

Periodo 

20 

2.004 

1.988 

1.996 

1.999 

2.018 

2.025 

2.002 

1.988 

2.011 

1.998 

1.980 

1.991 

2.005 

1.984 

2.009 

2.022 

1.969 

2.031 

1.976 

2.003 

1.998 

2.003 

1.996 

1.988 

2.023 

2.035 

2.018 

1.978 

1.998 

2.016 

1.994 

1.997 

2.008 

2.011 

2.010 

2.013 

1.984 

1.987 

2.023 

1.996 

2.006 

1.985 

2.007 

2.005 

1.993 

2.020 

1.990 

1.990 

1.998 

2.009 
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18.2 La tabla 18.6 contiene las anchuras de un producto obtenidas en 20 periodos. Los límites de control para la 
gráfica X-barra son LCL = 1.981 y UCL = 2.018. ¿Está alguna de las medias de los grupos fuera de estos 
límites de control? 

SOLUCIÓN 

L as medias de los 20 subgrupos son 1.9896,1.9974,2.0032,1.9916,2.0014,1.9890,1.9942,1.9952,2.0058,2.0066,1.9964, 
1.9928, 2.0024, 1.9974, 2.0106, 2.0230, 1.9926, 1.9948, 2.0012 y 2.0044, respectivamente. La media número dieciséis, 
2.0230, está fuera del límite superior de control. Todas las demás medias están dentro de los límites de control. 

18.3 Volviendo al problema 18.2, se encuentra que precisamente antes de muestrear el grupo número dieciséis hubo 
una falla. Este subgrupo se elimina, se vuelven a calcular los límites de control y se encuentra que los nuevos 
límites de control son LCL = 1.979 y UCL = 2.017. ¿Hay alguna otra media, además de la media del subgru¬ 
po dieciséis, que esté fuera de los nuevos límites de control? 

SOLUCIÓN 

Ninguna de las medias dadas en el problema 18.2, además de la número dieciséis, cae fuera de los nuevos límites. Suponiendo 
que la nueva gráfica satisfaga todas las otras pruebas para causas especiales, dadas en la tabla 18.3, los límites de control 
dados en este problema pueden emplearse para vigilar el proceso. 

18.4 Verificar los límites de control dados en el problema 18.2. Estimar la desviación estándar del proceso conjun¬ 
tando las 20 varlanzas muéstrales. 


SOLUCIÓN 

La media de las 100 observaciones muéstrales es 1.999. U na manera de hallar la varianza conjunta de estas 20 muestras es 
tratar estas 20 muestras, cada una con cinco observaciones, como una clasificación en un sentido. El error cuadrado medio 
dentro de los tratamientos es igual a la varianza conjunta de las 20 muestras. Empleando el análisis de M INITAB para un 
diseño en un sentido, se obtiene la siguiente tabla de análisis de varianza 


Analysis 

of 

Variance 




Source 

DF 

SS 

MS 

F 

P 

Factor 

19 

0.006342 

0.000334 

1.75 

0.044 

Error 

80 

0.015245 

0.000191 



Total 

99 

0.021587 





La estimación de la desviación estándares v/0.000191 =0.01382. El límite inferior de control es LCL = 1.999 - 3(0.01382/ 
\/5) = 1.981 y el límite superior de control es UCL = 1.999 + 3(0.01382/v / 5) = 2.018. 


PRUEBAS PARA CAUSAS ESPECIALES 

18.5 En la tabla 18.7 se presentan los datos de 20 subgrupos, cada uno de tamaño 5. La gráfica X-barra seda en la 
figura 18-7. ¿Qué efectos tuvo en el proceso un cambio a un nuevo proveedor en el periodo 10? ¿Cuál es la 
prueba para causas especiales, de la tabla 18.3, que no satisface el proceso? 

SOLUCIÓN 

En la gráfica de control de la figura 18-7 se observa que el cambio al nuevo proveedor ocasionó un aumento en la anchura. 
Este cambio después del periodo 10 es evidente. El 6 que aparece en la gráfica de la figura 18-7 indica que no se satisface 
la prueba 6 de la tabla 18.3. Cuatro de cinco puntos están a más de 1 sigma de la línea central (del mismo lado). Los cinco 
puntos corresponden a los subgrupos 4 a 8. 
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UCL = 2.02229 


X = 2.00342 


LCL= 1.98455 


Figura 18-7 MINITAB, puntos que no satisfacen la prueba 6 de la tabla 18.3. 


Tabla 18.7 


Periodo 

1 

Periodo 

2 

Periodo 

3 

Periodo 

4 

Periodo 

5 

Periodo 

6 

Periodo 

7 

Periodo 

8 

Periodo 

9 

Periodo 

10 

2.000 

2.007 

1.987 

1.989 

1.997 

1.983 

1.966 

2.004 

2.009 

1.991 

1.988 

1.988 

1.983 

1.989 

2.018 

1.972 

1.982 

1.998 

1.994 

1.989 

1.975 

2.002 

2.006 

1.997 

1.999 

2.002 

1.995 

2.011 

2.020 

2.000 

1.994 

1.978 

2.019 

1.976 

1.990 

1.991 

2.020 

1.991 

2.000 

2.016 

1.991 

2.012 

2.021 

2.007 

2.003 

1.997 

2.008 

1.972 

2.006 

2.037 


Periodo 

11 

Periodo 

12 

Periodo 

13 

Periodo 

14 

Periodo 

15 

Periodo 

16 

Periodo 

17 

Periodo 

18 

Periodo 

19 

Periodo 

20 

2.014 

1.998 

2.006 

2.009 

2.028 

1.996 

2.012 

1.998 

2.021 

2.008 

1.990 

2.001 

2.015 

1.994 

2.019 

2.020 

1.979 

2.041 

1.986 

2.013 

2.008 

2.013 

2.006 

1.998 

2.033 

2.022 

2.028 

1.988 

2.008 

2.026 

2.004 

2.007 

2.018 

2.021 

2.020 

2.023 

1.994 

1.997 

2.033 

2.006 

2.016 

1.995 

2.017 

2.015 

2.003 

1.998 

2.000 

2.000 

2.008 

2.019 


CAPACIDAD DEL PROCESO 

18.6 Volver al problema 18.2. Después de determinar una causa especial relacionada con el subgrupo 16, se eli mi na 
ese subgrupo. La anchura media se estima hallando la media de los datos de los 19 subgrupos restantes. Y la 
desviación estándar se estima hallando la desviación estándar de estos mismos datos. SI los límites de especi¬ 
ficación son LSL = 1.960 y USL = 2.040, hallar el índice i nferi or de capad dad, el índice superior de capacidad 
y el índice C PK . 
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SOLUCIÓN 


Empleando las 95 mediciones restantes, después de excluir al subgrupo 16, se encuentra que (1 
El índice inferior de capacidad es 


_ p - LSL 

3<t 


1.9982- 1.960 
0.0420 


0.910 


el índice superior de capacidad es 


Cpu — 


USL-p 

3(7 


2.040- 1.9982 
0.042 


0.995 


y C PK = mín{C PL , C PU } = 0.91. 


1.9982 y <7 = 0.01400. 


18.7 Volver al problema 18.1. a) Encontrar el porcentaje de no conformes si LSL = 495 y USL = 525. b) Encontrar 

las ppm de no conformes si LSL = 490 y USL = 530. 

SOLUCIÓN 

a) Suponiendo que el llenado tenga una distribución normal, el área bajo la curva normal abajo del LSL se encuentra 
empleando el comando deEXCEL =N0RMDI ST (4 9 5, 5 1 0, 5, 1), con el que se obtiene 0.001350. Por simetría, el 
área bajo la curva normal arriba del USL también es 0.001350. El total del área fuera de los límites de especificación 
es 0.002700. Las ppm de no conformes son 0.002700(1 000 000) = 2 700. 

b) El área bajo la curva normal correspondiente a LSL = 490 y a USL = 530 se halla de manera similar y es 0.000032 
+ 0.000032 = 0.000064. Se encuentra que las partes por millón son 0.000064(1 000 000) = 64. 


GRÁFICAS P Y WP 

18.8 Se inspeccionan circuitos impresos para detectar soldaduras imperfectas. A lo largo de 30 días, diariamente se 
inspeccionan 500 circuitos impresos. En la tabla 18.8 se presentan las cantidades de defectuosos. Elaborar una 
gráfica P y localizar las causas especiales. 


Tabla 18.8 


Día 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

# Defectuosos 

2 

0 

2 

5 

2 

4 

5 

1 

2 

3 

Día 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

# Defectuosos 

3 

2 

0 

4 

3 

8 

10 

4 

4 

5 

Día 

21 

22 

23 

24 

25 

26 

27 

28 

29 

30 

# Defectuosos 

2 

4 

3 

2 

3 

3 

2 

1 

1 

2 


SOLUCION 

Los límites de confianza son 


m-p) 


P = 3 


La línea central es p = 92/15 000 = 0.00613 y la desviación estándar es 


<p(l-p) _ / (0.00613)(0.99387) 
500 


= 0.00349 
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El límite inferior de control es 0.00613 - 0.01047 = -0.00434, que se toma igual a 0, ya que las proporciones no 
pueden ser negativas. El límite superior de control es 0.00613 + 0.01047 = 0.0166. El día 17 la proporción de defectuosos 
es P 17 = 10/500 = 0.02; es el único día en que la proporción es mayor al límite superior. 

18.9 Dados los datos del problema 18.8, proporcionar los límites de control de la gráfica-A/P. 

SOLUCIÓN 

Los límites de control para el número de defectuosos son np = 3\/np( 1 -p). La línea central es np = 3.067. El límite 
Inferior es 0 y el límite superior es 8.304. 

18.10 Supóngase que se empacan mascarillas para respiración en cajas con 25 o con 50 unidades. Durante cada turno, 
a Intervalos de 30 minutos, se toma de manera aleatoria una caja y se determina la cantidad de defectuosas en 
ella. La caja puede contener 25 o 50 mascarillas. La cantidad de mascarillas examinadas por turno varía entre 
400 y 800. En la tabla 18.9 se presentan los datos. Usar M INITAB para elaborar la gráfica de control para la 
proporción de defectuosas. 


Tabla 18.9 


Turno # 

Tamaño de 
la muestra 

Cantidad de 
defectuosas 

x, 

Proporción de 
defectuosas 

P i =X i /n¡ 

1 

400 

3 

0.0075 

2 

575 

7 

0.0122 

3 

400 

1 

0.0025 

4 

800 

7 

0.0088 

5 

475 

2 

0.0042 

6 

575 

0 

0.0000 

7 

400 

8 

0.0200 

8 

625 

1 

0.0016 

9 

775 

10 

0.0129 

10 

425 

8 

0.0188 

11 

400 

7 

0.0175 

12 

400 

3 

0.0075 

13 

625 

6 

0.0096 

14 

800 

5 

0.0063 

15 

800 

4 

0.0050 

16 

800 

7 

0.0088 

17 

475 

9 

0.0189 

18 

800 

9 

0.0113 

18 

750 

9 

0.0120 

20 

475 

2 

0.0042 


SOLUCIÓN 

Cuando varía el tamaño de la muestra, la línea central siempre es la misma, es decir, es la proporción de defectuosos en 
todas las muestras. Pero la desviación estándar varía de una muestra a otra y los límites de control que se obtienen son 
límites de control escalonados. Los límites de control son 


W -P) 

n¡ 


P = 3 
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La línea central es p — 108/11 775 = 0.009172. Para el primer subgrupo, se tienen, = 400 

mee , imim^rn , «.«o™, 

V n¡ V 400 

y 3(0.004767) = 0.014301. El límite Inferior del subgrupo 1 es 0 y el límite superior es 0.009172 + 0.014301 = 0.023473. 
Los límites de los turnos restantes se determinan de igual manera. Estos límites cambiantes dan lugar a límites superiores 
de control escalonados, como se muestran en la figura 18-8. 



UCL = 0.02229 


P = 0.00917 


LCL = 0 


Muestra 


Pruebas realizadas con tamaños de muestras variables 

Figura 18-8 Gráfica P para tamaños de muestra variables. 


OTRASGRÁFICASDE CONTROL 

18.11 En los casos en que las mediciones resultan muy costosas, los datos se obtienen lentamente, o cuando la pro¬ 
ducción es bastante homogénea lo Indicado es una gráfica de lecturas o mediciones individuales de rangos 
móviles. Los datos consisten en una sola medición tomada en diferentes momentos. La línea central es la media 
de todas las medí clones Indi vi duales y la variación se estima mediante el uso de rangos móviles. Normalmente, 
los rangos móviles se calculan restando los valores de datos adyacentes y tomando el valor absoluto del valor 
resultante. En la tabla 18.10 se presentan las mediciones codificadas de la resistencia a la ruptura de un costo¬ 
so cableempleado en los aviones. Del proceso de producción, se toma un cable por día y se prueba. Proporcionar 
la gráfica de lecturas Individuales generada con M INITAB e Interpretar los resultados. 


Tabla 18.10 


Día 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

Resistencia 

491.5 

502.0 

505.5 

499.6 

504.1 

501.3 

503.5 

504.3 

498.5 

508.8 

Día 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

Resistencia 

515.4 

508.0 

506.0 

510.9 

507.6 

519.1 

506.9 

510.9 

503.9 

507.4 
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SOLUCIÓN 

Se emplea la secuencia siguiente Stats^ Control charts^ individuáis. 



Figura 18-9 G ráfica de mediciones individuales para la resistencia. 


En la figura 18-9 se presenta la gráfica de lecturas Individuales correspondiente a los datos de la tabla 18.10. En esta 
gráfica de control se grafican los valores de las lecturas individuales de la tabla 18.10. El 2 que aparece en las semanas 9 y 
18 de la gráfica de control hace referencia a la segunda prueba para causas especiales de la tabla 18.3. Esta Indicación de 
una causa especial corresponde a nueve puntos consecutivos de un mismo lado de la línea central. En el periodo 10, un 
aumento de la temperatura del proceso ocasionó incremento en la resistencia a la ruptura. Este cambio en la resistencia a 
la ruptura resultó en puntos debajo de la línea central antes del periodo 10 y puntos sobre la línea central después del perio¬ 
do 10. 


18.12 L a gráfica EWM A de promedios móviles exponencialmente ponderados se usa para detectar pequeños cambl os 
respecto a un valor objetivo t. Los puntos de la gráfica EWM A están dados por la ecuación siguiente: 

x¡ = wx¡ + (1 - w)Xi_ y 

Para ilustrar el uso de esta ecuación, supóngase que los datos de la tabla 18.7 hayan sido seleccionados de un 
proceso cuyo valor objetivo sea 2 000. El valor inicial x 0 se elige igual al valor objetivo, 2 000. Como peso w 
suele elegirse un valor entre 0.10 y 0.30. SI no se especifica ningún valor, M INITAB utiliza 0.20. El primer 
punto de la gráfica EWM A será x¡ = wx x + (1 - w) x 0 + 0.20(1.9896) + 0.80(2.000) = 1.9979. El segundo 
punto de la gráfica será x 2 = wx 2 + (1 -w)x x = 0.20(1.9974) + 0.80(1.9979) = 1.9978, etc. El análisis de 
M INITAB se obtiene empleando la secuencia siguiente Stat —> Control charts-* EWM A. Es necesario pro¬ 
porcionar a M INITAB el valor objetivo. En la figura 18-10 se muestran los resultados. De acuerdo con la 
figura, determinar en qué subgrupo se desvía el proceso del valor objetivo. 

SOLUCIÓN 

La gráfica de los valores x¡ cruza el límite superior de control con el punto correspondiente al periodo 15. Éste es el punto 
en el que se concluirá que el proceso se aleja del valor objetivo. Obsérvese que la gráfica EW M A tiene límites de control 
escalonados. 
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UCL = 2.00629 


X = 2 


LCL = 1.99371 


Muestra 

Figura 18-10 Gráfica de promedios móviles exponencial mente ponderados. 


18.13 Una gráfica de zonas se divide en cuatro zonas. La zona 1 se define como los valores a no más de 1 desviación 
estándar de la media, la zona 2 se define como los valores entre 1 y 2 desviaciones estándar de la media, la zona 
3 se define como los valores entre 2 y 3 desviaciones estándar de la media, y la zona 4 como los valores a 3 o 
más desviaciones estándar de la media. SI no se especifica otra cosa, M INITAB asigna a las zonas 1 a 4 los 
valores 0, 2, 4 y 8, respectivamente. Los puntos que se encuentran de un mismo lado de la línea central se 
suman. SI una suma acumulada es mayor o Igual al peso asignado a la zona 4, eso se considera como una señal 
de que el proceso está fuera de control. Después de que un proceso se señala como fuera de control o cuando 
el siguiente punto graficado cruza la línea central, la suma acumulada se ¡guala a 0. En la figura 18-11 se pre¬ 
senta el análisis de M INITAB empleando una gráfica de zonas para los datos de la tabla 18.6. La secuencia para 
obtener esta gráfica es Stat —> Control charts —>• Zone. ¿Qué puntos se encuentran fuera de control en esta 
gráfica de zona? 

SOLUCIÓN 

El subgrupo 16 corresponde a un punto fuera de control. La puntuación de zona correspondiente al subgrupo 16 es 10, que 
es mayor a la puntuación asignada a la zona 4, con lo que en el proceso se localiza un periodo fuera de control. 



+3 DesvEst = 2.01806 
+2 DesvEst = 2.01187 
+1 DesvEst = 2.00567 

1.99948 

-1 DesvEst = 1.99329 
-2 DesvEst = 1.98709 
-3 DesvEst = 1.98090 


Muestra 

Figura 18-11 Gráfica de zonas para las anchuras. 
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18.14 Cuando lo que Interesa es el número de no conformidades o de defectos en un producto, y no sólo determinar 
si el producto está o no defectuoso, se usa la gráfica Cola gráfica U. Para usar estas gráficas es importante 
definir la unidad de inspección. La unidad de Inspección se define como la unidad de producción (de salida) a 
ser muestreada y examinada respecto a no conformidades. SI sólo hay una unidad de inspección por muestra, 
se usa una gráfica C; si la cantidad de unidades de Inspección por muestra varía, se usa una gráfica U. 

La fabricación de productos en rollo, como papel, películas, textiles, plásticos, etc., es un área en la que se 
usan la gráfica C y la gráfica U. No conformidades o defectos, como la aparición de puntos negros en una 
película fotográfica, atadijos de fibras, manchas, agujeritos, marcas por electricidad estática, suelen presentar¬ 
se en algún grado en la fabricación de productos en rollo. El propósito de las gráficas C y ti es garantizar que 
en el resultado del proceso la ocurrencia de tales Inconformidades permanezca dentro de un nivel aceptable. 
Estas no conformidades suelen presentarse en forma aleatoria e Independiente unas de otras en toda el área del 
producto. En estos casos, para elaborar la gráfica de control se emplea la distribución de Polsson. La línea 
central de una gráfica C se localiza en c, la cantidad media de no conformidades en todos los subgrupos. 
La desviación estándar en la distribución de Poisson es y/E, y por lo tanto los límites de control 3 slgma son 
c ± 3y/E. Es decir, el límite Inferior de control es LCL = c - 3y/E y el límite superior de control es UCL = 
C 3 yfc. 

Cuando se aplica un recubrimiento a un material, suelen formarse pequeñas no conformidades llamadas 
aglomerados. E n los rollos jumbo de un producto se registra la cantidad de aglomerados por 5 pies (ft) de rollo. 
En la tabla 18.11 se presentan los resultados en 24 de estos rollos. ¿Hay algún punto fuera de los límites de 
control 3 slgma? 


Tabla 18.11 


Rollo jumbo # 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

Aglomerados 

3 

3 

6 

0 

7 

5 

3 

6 

3 

5 

2 

2 

Rollo jumbo # 

13 

14 

15 

16 

17 

18 

19 

20 

21 

22 

23 

24 

Aglomerados 

2 

7 

6 

4 

7 

8 

5 

13 

7 

3 

3 

7 


SOLUCIÓN 

La cantidad media de aglomerados por rollo jumbo es igual a la cantidad total de aglomerados dividida entre 24, esto es, 
c = 117/24 = 4.875. La desviación estándar es VF = 2.208. El límite inferior de control es LCL = 4.875 - 3(2.208) = 
-1.749. Como este valor es negativo, se toma 0 como límite Inferior. El límite superior es UCL = 4.875 + 3(2.208) = 
11.499. En el rollo jumbo #20 hay una condición fuera de control, ya que la cantidad de aglomerados, 13, es mayor al 
límite superior de control, 11.499. 


18.15 Este problema es continuación del problema 18.14. A ntes de hacer este problema se deberá revisar el problema 
18.14. En la tabla 18.12 se dan los datos de 20 rollos jumbo. En la tabla se da el número del rollo, la longitud 
del rollo Inspeccionada para detectar aglomerados, la cantidad de unidades Inspeccionadas (recuérdese que 
según el problema 18.14, una unidad de Inspección es 5 ft), la cantidad de aglomerados encontrados en la 
longitud Inspeccionada y la cantidad de aglomerados por unidad Inspeccionada. La línea central de la gráfica 
U es ü, la suma de la columna 4 dividida entre la suma de la columna 3. Sin embargo, la desviación estándar 
cambia de una muestra a otra y hace que los límites d e con trol sean límites de control escalonados. El límite 
Inferior de cont rol d e la muestra / es UCL = ü - 3y/ü/n¡ y el límite superior de control de la muestra i es 
U C L = ü + 3 y/ü/n¡. 
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Tabla 18.12 


Rollo jumbo # 

Longitud 

inspeccionada 

#de unidades 
inspeccionadas, n¡ 

#de 

aglomerados 

“/ = 

Col. 4/Col. 3 

1 

5.0 

1.0 

6 

6.00 

2 

5.0 

1.0 

4 

4.00 

3 

5.0 

1.0 

6 

6.00 

4 

5.0 

1.0 

2 

2.00 

5 

5.0 

1.0 

3 

3.00 

6 

10.0 

2.0 

8 

4.00 

7 

7.5 

1.5 

6 

4.00 

8 

15.0 

3.0 

6 

2.00 

9 

10.0 

2.0 

10 

5.00 

10 

7.5 

1.5 

6 

4.00 

11 

5.0 

1.0 

4 

4.00 

12 

5.0 

1.0 

7 

7.00 

13 

5.0 

1.0 

5 

5.00 

14 

15.0 

3.0 

8 

2.67 

15 

5.0 

1.0 

3 

3.00 

16 

5.0 

1.0 

5 

5.00 

17 

15.0 

3.0 

10 

3.33 

18 

5.0 

1.0 

1 

1.00 

19 

15.0 

3.0 

8 

2.67 

20 

15.0 

3.0 

15 

5.00 


Usar M INITAB para elaborar la gráfica de control para este problema y determinar si el proceso está bajo 
control. 

SOLUCIÓN 

La línea central de la gráfica U es n, la suma de la columna 4 entre la suma de la columna 3. Pero la desviación estándar 
cambia de una mue stra a otra y hace que los límites de control sean escalonados. El límite inferior de control de la muestra 
/ es LCL = ü - 3y/ü/n¡ y el límite superior de control de la muestra / es UCL mü + 3^/üJñ¡. La línea central correspon- 



UCL = 7.0 7 


U = 3.73 


LCL = 0.38 


Prueba realizada con tamaños de muestra diferentes 

Figura 18-12 Gráfica U para aglomerados. 
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diente a los datos anteriores es u = 123/33 = 3.73. La solución de M INITAB se obtiene mediante la secuencia Stat -> 
C ontrol C harts -> U. 

La información que requiere M IN ITAB para elaborar la gráfica U es la dada en las columnas 3 y 4 de la tabla 18.12. 
En la figura 18-12 se muestra la gráfica U de los datos de la tabla 18.12. La gráfica de control no indica que ningún perio¬ 
do esté fuera de control. 


PROBLEMAS SUPLEMENTARIOS 


GRÁFICAX-BARRAY GRÁFICA R 

18.16 En la tabla 18.13 se presentan los datos de 10 subgrupos, cada uno de tamaño 4. Para cada_subgrupo calcular X y R, así 
como X y R. En una gráfica señalar los valores de X y la línea central correspondiente a X. En otra gráfica mostrar los 
valores deR junto con la línea central correspondiente a R. 


Tabla 18.13 


Subgrupo 

Observaciones del subgrupo 

1 

13 

11 

13 

16 

2 

11 

12 

20 

15 

3 

16 

18 

20 

15 

4 

13 

15 

18 

12 

5 

12 

19 

11 

12 

6 

14 

10 

19 

16 

7 

12 

13 

20 

10 

8 

17 

17 

12 

14 

9 

15 

12 

16 

17 

10 

20 

13 

18 

17 


18.17 U na empresa de alimentos congelados elabora paquetes de ejotes de una libra (Ib) (454 g). Cada hora se toman cuatro 
paquetes y se pesan con una exactitud de décimas de gramo. En la tabla 18.14 se presentan los datos obtenidos durante una 
semana. 


Tabla 18.14 


Lunes 

10:00 

Lunes 

12:00 

Lunes 

2:00 

Lunes 

4:00 

M artes 
10:00 

M artes 
12:00 

M artes 
2:00 

M artes 
4:00 

M ¡ércoles 
10:00 

M ¡ércoles 
12:00 

453.0 

451.6 

452.0 

455.4 

454.8 

452.6 

453.6 

453.2 

453.0 

451.6 

454.5 

455.5 

451.5 

453.0 

450.9 

452.8 

456.1 

455.8 

451.4 

456.0 

452.6 

452.8 

450.8 

454.3 

455.0 

455.5 

453.9 

452.0 

452.5 

455.0 

451.8 

453.5 

454.8 

450.6 

453.6 

454.8 

454.8 

453.5 

452.1 

453.0 


M ¡ércoles 
2:00 

M ¡ércoles 
4:00 

J ueves 
10:00 

J ueves 
12:00 

J ueves 
2:00 

J ueves 
4:00 

Viernes 

10:00 

Viernes 

12:00 

Viernes 

2:00 

Viernes 

4:00 

454.7 

451.1 

452.2 

454.0 

455.7 

455.3 

454.2 

451.1 

455.7 

450.7 

451.4 

452.6 

448.9 

452.8 

451.8 

452.4 

452.9 

453.8 

455.3 

452.5 

450.9 

448.5 

455.3 

455.5 

451.2 

452.3 

451.5 

452.4 

455.4 

454.1 

455.8 

454.4 

453.9 

453.8 

452.8 

452.3 

455.8 

454.3 

453.7 

454.2 
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Usar el método visto en el problema 18.4 para estimar la desviación estándar conjuntando las varianzasde las 20 mues¬ 
tras. Usar esta estimación para hallar los límites de control de la gráfica X-barra. ¿Seencuentra alguna de las 20 medias de 
los subgrupos fuera de los límites de control? 

18.18 Los límites de control en la gráfica R délos datos de la tabla 18.14 son LCL = 0 y UCL = 8.205. ¿Se encuentra alguno de 
los rangos de los subgrupos fuera de los límites 3 sigma? 

18.19 El proceso del problema 18.17 mediante el cual se llenan paquetes de ejotes de 1 Ib se modifica con objeto de reducir la 
variabilidad de los pesos de los paquetes. Después de haber empleado esta modificación durante algún tiempo, se vuelven 
a recolectar los datos de toda una semana y se grafican los rangos de los nuevos subgrupos usando los límites de control 
dados en el problema 18.18. En la tabla 18.15 se presentan los nuevos datos. ¿Parece haberse reducido a la variabilidad? Si 
se ha reducido la variabilidad, encontrar nuevos límites de control para la gráfica X empleando los datos de la tabla 
18.15. 


Tabla 18.15 


Lunes 

10:00 

Lunes 

12:00 

Lunes 

2:00 

Lunes 

4:00 

M artes 
10:00 

M artes 
12:00 

M artes 
2:00 

M artes 
4:00 

M ¡ércoles 
10:00 

M ¡ércoles 
12:00 

454.9 

454.2 

454.4 

454.7 

454.3 

454.2 

454.6 

453.6 

454.4 

454.6 

452.7 

453.6 

453.6 

453.9 

454.2 

452.8 

454.5 

453.2 

455.0 

454.1 

457.0 

454.4 

453.6 

454.6 

454.2 

453.3 

454.3 

453.6 

454.6 

453.3 

454.2 

453.9 

454.3 

453.9 

453.4 

453.3 

454.9 

453.1 

454.1 

454.3 


M ¡ércoles 
2:00 

M ¡ércoles 
4:00 

J ueves 
10:00 

J ueves 
12:00 

J ueves 
2:00 

J ueves 
4:00 

Viernes 

10:00 

Viernes 

12:00 

Viernes 

2:00 

Viernes 

4:00 

453.0 

453.9 

453.8 

455.1 

454.2 

454.4 

455.1 

455.7 

452.2 

455.4 

454.0 

454.2 

453.3 

453.3 

453.0 

452.6 

454.6 

452.8 

453.7 

452.8 

452.9 

454.3 

454.1 

454.7 

453.8 

454.9 

454.1 

453.8 

454.4 

454.7 

454.2 

454.7 

454.7 

453.9 

453.9 

454.2 

454.6 

454.9 

454.5 

455.1 


PRUEBAS PARA CAUSAS ESPECIALES 

18.20 Los operadores que hacen ajustes a las máquinas continuamente son un problema en los procesos industriales. La tabla 
18.16 contiene un conjunto de datos (20 muestras cada una de tamaño 5) en las que éste es el caso. Encontrar los límites de 
control de la gráfica X-barra, elaborar la gráfica X-barra y hacer las ocho pruebas para causas especiales dadas en la tabla 
18.3. 


Tabla 18.16 


1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

2.006 

2.001 

1.993 

1.983 

2.003 

1.977 

1.972 

1.998 

2.015 

1.985 

1.994 

1.982 

1.989 

1.983 

2.024 

1.966 

1.988 

1.992 

2.000 

1.983 

1.981 

1.996 

2.012 

1.991 

2.005 

1.996 

2.001 

2.005 

2.026 

1.994 

2.000 

1.972 

2.025 

1.970 

1.996 

1.985 

2.026 

1.985 

2.006 

2.010 

1.997 

2.006 

2.027 

2.001 

2.009 

1.991 

2.014 

1.966 

2.012 

2.031 



































502 Capítulo 18 Control estadístico de procesos y capacidad de procesos 


11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

2.010 

1.982 

2.002 

1.993 

2.024 

1.980 

2.008 

1.982 

2.017 

1.992 

1.986 

1.985 

2.011 

1.978 

2.015 

2.004 

1.975 

2.025 

1.982 

1.997 

2.004 

1.997 

2.002 

1.982 

2.029 

2.006 

2.024 

1.972 

2.004 

2.010 

2.000 

1.991 

2.014 

2.005 

2.016 

2.007 

1.990 

1.981 

2.029 

1.990 

2.012 

1.979 

2.013 

1.999 

1.999 

1.982 

1.996 

1.984 

2.004 

2.003 


CAPACIDAD DE PROCESOS 

18.21 Supóngase que los límites de especificación para los paquetes de comida congelada del problema 18.17 son LSL = 450 g 
y USL = 458 g. Usar las estimaciones de ^ y a obtenidas en el problema 18.17 para hallar C PK . Estimar también las ppm 
que no satisfacen las especificaciones. 

18.22 En el problema 18.21, calcular el C PK y estimar las ppm de no conformes después de las modificaciones hechas en el pro¬ 
blema 18.19. 


GRÁFICASPY NP 

18.23 U na empresa produce fusibles para el sistema eléctrico de los automóviles. A lo largo de 30 días se prueban 500 fusibles 
por día. En la tabla 18.17 se presenta la cantidad de fusibles defectuosos hallados por día. Determinar la línea central y los 
límites superior e Inferior de control de la gráfica P. ¿Parece estar el proceso bajo control estadístico? Si el proceso está 
bajo control estadístico, dar una estimación puntual de las tasas de ppm de defectuosos. 


Tabla 18.17 


Día 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

#de defectuosos 

3 

3 

3 

3 

1 

1 

1 

1 

6 

1 

Día 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

#de defectuosos 

1 

1 

5 

4 

6 

3 

6 

2 

7 

3 

Día 

21 

22 

23 

24 

25 

26 

27 

28 

29 

30 

#de defectuosos 

2 

3 

6 

1 

2 

3 

1 

4 

4 

5 


18.24 Supóngase que en el problema 18.23, el fabricante defusi bles decide usar una gráfica NP en lugar de una gráfica P. Encontrar 
la línea central y los límites superior e inferior de control de esta gráfica. 


18.25 Scottie Long, el gerente del departamento de carnes de una cadena grande de supermercados, desea saber cuál es el por¬ 
centaje de paquetes de carne para hamburguesa que muestran ligera decoloración. Cada día se inspeccionan varios paque¬ 
tes y se anota el número de ellos que muestra una pequeña decoloración. Estos datos se presentan en la tabla 18.18. 
Proporcionar los límites escalonados superiores de control de estos 20 subgrupos. 
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Tabla 18.18 


Día 

Tamaño del 
subgrupo 

Cantidad de 
decolorados 

Porcentaje de 
decolorados 

1 

100 

1 

1.00 

2 

150 

1 

0.67 

3 

100 

0 

0.00 

4 

200 

1 

0.50 

5 

200 

1 

0.50 

6 

150 

0 

0.00 

7 

100 

0 

0.00 

8 

100 

0 

0.00 

9 

150 

0 

0.00 

10 

200 

2 

1.00 

11 

100 

1 

1.00 

12 

200 

1 

0.50 

13 

150 

3 

2.00 

14 

200 

2 

1.00 

15 

150 

1 

0.67 

16 

200 

1 

0.50 

17 

150 

4 

2.67 

18 

150 

0 

0.00 

19 

150 

0 

0.00 

20 

150 

2 

1.33 


OTRAS GRÁFICAS DE CONTROL 

18.26 Antes de revisar este problema, leer el problema 18.11. Durante 24 horas se lee cada hora la temperatura de un horno que 
se usa para elaborar pan. La temperatura de horneado es crítica en el proceso y el horno trabaja sin interrupción a lo largo 
de todos los turnos. Estos datos se presentan en la tabla 18.19. Para vigilar la temperatura del proceso se emplea una gráfi¬ 
ca de mediciones individuales. Encontrar la línea central y los rangos móviles correspondientes al uso de pares adyacentes 
de mediciones. ¿Cómo se encuentran los límites de control? 


Tabla 18.19 


Hora 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

Temperatura 

350.0 

350.0 

349.8 

350.4 

349.6 

350.0 

349.7 

349.8 

349.4 

349.8 

350.7 

350.9 

Hora 

13 

14 

15 

16 

17 

18 

19 

20 

21 

22 

23 

24 

Temperatura 

349.8 

350.3 

348.8 

351.6 

350.0 

349.7 

349.8 

348.6 

350.5 

350.3 

349.1 

350.0 


18.27 A ntes de revisar este problema, leer el problema 18.12. U sar M INITA B para elaborar una gráfica EW M A con los datos de 
la tabla 18.14. U sando como valor objetivo 454 g, ¿qué indica esta gráfica respecto al proceso? 

18.28 A ntes de revisar este problema, leer el problema 18.13 que se refiere a las gráficas de zonas. Con los datos de la tabla 18.16, 
elaborar una gráfica de zonas. ¿Indica la gráfica de zonas que haya algunas situaciones fuera de control? ¿Qué deficiencia 
de las gráficas de zonas muestra este problema? 
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18.29 Antes de revisar este problema, leer el problema 18.15. Dar los límites decontrol escalonados de la gráfica L/ del problema 
18.15. 


18.30 En el control de calidad se emplean también las gráficas de Pareto. U na gráfica dePareto es una gráfica de barrasen la que 
se enumeran los defectos observados en orden descendente. Los defectos que se encuentran con mayor frecuencia aparecen 
primero en la lista, seguidos por aquellos que se encuentran con menos frecuencia. Usando estas gráficas se pueden iden¬ 
tificar áreas de problema para corregir aquellas causas a las que se debe el mayor porcentaje de defectos. En mascarillas 
para respiración inspeccionadas durante cierto tiempo, se encontraron los siguientes defectos: decoloración, tirante faltan- 
te, abolladuras, roturas y agujeros. En la tabla 18.20 se muestran los resultados. 


Tabla 18.20 


decoloración 

decoloración 

decoloración 

tirante 

tirante 

tirante 

decoloración 

abolladura 

tirante 

decoloración 

tirante 

decoloración 

tirante 

decoloración 

decoloración 

decoloración 

decoloración 

abolladura 

decoloración 

abolladura 

ruptura 

ruptura 

agujero 

decoloración 

abolladura 

decoloración 

agujero 

decoloración 

ruptura 

ruptura 


En la figura 18-13 se presenta una gráfica de Pareto generada con M INITAB. Los datos que aparecen en la tabla 18.20 
se Ingresan en la columna 1 de la hoja de cálculo. La secuencia para elaborar esta gráfica es la siguiente: "Stat -> Quality 
tools-> Pareto charts". De acuerdo con la gráfica de Pareto, ¿a qué tipo de defecto debe dársele mayor atención? ¿Cuáles 
son los dos tipos de defectos a los que debe dárseles mayor atención? 


Gráfica dePareto para defectos 



defecto 

decoloración 

tirante 

abolladura 

ruptura 

agujero 

Cuenta 

14 

6 

4 

4 

2 

Porcentaje 

46.7 

20.0 

13.3 

13.3 

6.7 

% acum. 

46.7 

66.7 

80.0 

93.3 

100.0 


Figura 18-13 Defectos en mascarillas para respiración. 
























Respuestas a 

LOS PROBLEMAS 
SUPLEMENTARIOS 


CAPÍTULO 1 

1.46 a) continua; b ) continua; c) discreta; d) discreta; e) discreta. 

1.47 a) Desde cero en adelante; continua, b ) 2, 3,...; discreta. 

c) Soltero, casado, divorciado, separado, viudo; discreta, d) Desde cero en adelante; continua, 
e) 0, 1, 2,...; discreta. 

1.48 a) 3 300; b) 5.8; c) 0.004; d) 46.74; e) 126.00; f) 4 000 000; g ) 148; h) 0.000099; /) 2 180; j) 43.88. 

1.49 a) 1 325 000; b) 0.0041872; c) 0.0000280; c/) 7 300 000 000; e) 0.0003487; f) 18.50. 

1.50 a) 3; b) 4; c) 7; d) 3; e) 8; f) una cantidad ilimitada; g) 3; h) 3; /) 4; j) 5. 

1.51 a) 0.005 millones de bu o 5 000 bu; tres, b) 0.000000005 cm o 5 x 10~ 9 cm; cuatro, c) 0.5 ft; cuatro. 

d) 0.05 x 10 8 m o bien 5 x 10 6 m; dos. e) 0.5 mi/s; seis, f) 0.5 millares de mi/s o bien 500 mi/s; tres. 

1.52 a) 3.17 x 10- 4 ; b) 4.280 x 10 8 ; c) 2.160000 x 10 4 ; d) 9.810 x 10- 6 ; e) 7.32 x 10 5 ; f) 1.80 x 10- 3 . 

1.53 a) 374; b) 14.0. 

1.54 a) 280 (dos cifras significativas), 2.8 centenas o 2.8 x 10 2 ; b) 178.9; 

c) 250 000 (tres cifras significativas), 250 millares o 2.50 x 10 5 ; d ) 53.0; e) 5.461; f) 9.05; 

g) 11.54; h ) 5 745 000 (cuatro cifras significativas), 5 745 millares, 5.745 millones o 5.745 x 10 6 ; /) 1.2; 

i) 4 157. 
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1.55 a) -11; b ) 2; c) f o bien 4.375; d) 21; e) 3; f) -16; g) V9S o 9.89961 aproximadamente; 

h) -1 /VÍA o bien -1.20049 aproximadamente; /) 32; j) lO/vTz o bien 2.42536 aproximadamente. 

1.56 a) 22,18,14,10, 6, 2, -2, -6 y -10; b) 19.6,16.4,13.2, 2.8, -0.8, -4 y -8.4; 

c) -1.2, 30,10 - 4v^2 = 4.34 aproximadamente y 10 + 47r = 22.57 aproximadamente; 

d) 3,1, 5, 2.1, -1.5, 2.5 y 0; e) X = i(10 -Y). 

1.57 a) -5; b) -24; c) 8. 

1.58 a) -8; b) 4; c) -16. 

1.76 a) -4; b) 2; c) 5; d) |; e) 1; f) -7. 

1.77 a) a = 3, b = 4; b) a = -2 ,b = 6; c) X = -0.2, y = -1.2; 

d) A = isí = 26.28571 aproximadamente, B = ^2 = 15.71429 aproximadamente; e) a = 2, £> = 3, c = 5; 
f) X = -1, y = 3, Z = -2; g) U = 0.4,1/ = -0.8,1/1/ = 0.3. 

1.78 b) (2, -3); es decir, X = 2, y = -3. 

1.79 a) 2, -2.5; b) 2.1 y -0.8 aproximadamente. 

1.80 a) o bien 2.12 y-0.79 aproximadamente. 

b) 2 y -2.5. 

c) 0.549 y -2.549 aproximadamente. 

~8¿x/= 36 = -8¿x/36x/^I = -8 i 6/ = _ 4 ± 3 . donde f = yn. 

2 2 2 

Estas raíces son números complejos y no se mostrarán cuando se emplee un procedimiento gráfico. 

1.81 a) -6.15 < -4.3 < -1.5 < 1.52 < 2.37; b) 2.37 > 1.52 > -1.5 > -4.3 > -6.15. 

1.82 a) 30 < N < 50; b) S > 7; c) -4 < X < 3; d) P < 5; e) X - y > 2. 

1.83 a) X >4; b) X > 3; c) N < 5; cf) y < 1; e) —8 <X < 7; f) -1.8 < N < 3; g) 2 < a < 22. 

1.84 a) 1; b) 2; c) 3; cf) -1; e) -2. 

1.85 a) 1.0000; b) 2.3026; c) 4.6052; d) 6.9076; e) -2.3026. 

1.86 a) 1; b) 2; c) 3; cf) 4; e) 5. 

1.87 Debajo de cada respuesta se muestra el comando de EXCEL. 

1.160964 1.974636 2.9974102 1.068622 1.056642 

=LOG(5,4) =LOG(24,5) =LOG(215,6) =LOG(8,7) =LOG(9,8) 


1.88 > evalf (log[4] (5) ) ; 1.160964047 

>evalf(log[5](24)); 1.974635869 

> evalf(log[6] (215)) ; 2.997410155 
>evalf(log[7](8)); 1.068621561 

>evalf(log[8](9)); 1.056641667 



= 31n(fl) + 41n(6) — 51n(c) 

= log(x) + log(y) + log(-) - 3log(iv) 
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1.91 51n(a) — 41n (tí) + ln(c) + \n{d) = ln 

1.92 log(«) + log(v) + log(vv) - 2log(x) - 31og(y) - 41og(z) = log 

1.93 104/3. 


1.94 

1.95 

1.96 165.13. 


2, -5/3. 

5 Vi. 5 VI. 
2 ^ 2 2 l ' 


1.97 471.71. 

1.98 402.14. 

1.99 2.363. 

1.100 0.617. 


CAPÍTULO 2 


2.19 

b ) 62. 


2.20 

a) 799; b) 1 000; c) 949.5; d) 1 099.5 y 1199.5; e) 100 (horas); f) 76; 
g) ü = 0.155 o 15.5%; h ) 29.5%; /) 19.0%; j) 78.0%. 


2.25 

a) 24%; b) 11%; c) 46%. 


2.26 

a) 0.003 in; b) 0.3195, 0.3225, 0.3255,..., 0.3375 ¡n. 

C) 0.320-0.322, 0.323-0.325, 0.326-0.328. 0.335-0.337 ¡n. 


2.31 

a) Cada una es de 5 años; b) cuatro (aunque estrictamente hablando el tamaño de la última clase no está especificado); 
c) uno; d) (85-94); e) 7 años y 17 años; f) 14.5 años y 19.5 años; g) 49.3% y 87.3%; h) 45.1%; 

/) no se puede determinar. 

2.33 

19.3, 19.3, 19.1, 18.6, 17.5, 19.1, 21.5, 22.5, 20.7, 18.3, 14.0, 11.4, 10.1, 
debido a los errores de redondeo en los porcentajes.) 

18.6, 11.4 y 3.7. (Esto no suma 265 millones 

2.34 

b) 0.295, c) 0.19; cf) 0. 



CAPÍTULO 3 

3.47 a) X¡ + X 2 + X 3 + X 4 + 8 

V)f\X{ -f/ 3^3 + f 4 X 4 +f¡X¡ 

c ) U\(U\ +6) U2(U2 6) H - U^Ut, H- 6) 

d) Y¡ + Y\ + • • ■ + Y% - 4iV 

e) 4X¡ Y¡ + 4Y 2 Y 2 + 4X 3 Y 3 + 4X 4 V 4 . 

a)J2(X i + 3) 3 ; b)J^fj(Yj-a) 2 -, 

7=1 7=i 


c)J2(2Xj-3Yj) 


7=1 


3.48 
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12 



J= 1 


3.51 a) 20; b) -37; c) 53; cf) 6; e) 226; f) -62; g) f§. 

3.52 a) -1; b) 23. 

3.53 86 . 

3.54 0.50 s. 

3.55 8.25. 

3.56 a) 82; b ) 79. 

3.57 78. 

3.58 66.7% varones y 33.3% mujeres. 

3.59 11.09 tons. 

3.60 501.0 

3.61 0.72642 cm. 

3.62 26.2. 

3.63 715 min. 

3.64 b) 1.7349 cm. 

3.65 a) media = 5.4, mediana = 5; b) media = 19.91, mediana = 19.85. 

3.66 85. 

3.67 0.51 S. 

3.68 8 . 

3.69 11.07 tons. 

3.70 490.6. 

3.71 0.72638 cm. 

3.72 25.4. 

3.73 Aproximadamente78.3 años. 

3.74 35.7 años. 

3.75 708.3 min. 
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3.76 a) M edia = 8.9, mediana = 9, moda = 7. 

b ) M edia = 6.4, mediana = 6. Como cada uno de los números 4, 5, 6, 8 y 10 se presentan dos veces, se puede considerar 

que éstos son cinco modas; sin embargo, en este caso es más razonable concluir que no hay moda. 

3.77 No existe una puntuación modal. 

3.78 0.53 s. 

3.79 10. 

3.80 11.06 tons. 

3.81 462. 

3.82 0.72632 cm. 

3.83 23.5. 

3.84 668.7 min. 

3.85 a) 35-39; b) 75 a 84. 

3.86 a) Empleando la fórmula (9), moda = 11.1 Empleando la fórmula (10), moda = 11.3 

b ) Empleando la fórmula (9), moda = 0.7264 Empleando la fórmula (10), moda = 0.7263 

c) Empleando la fórmula (9), moda = 23.5 Empleando la fórmula (10), moda = 23.8 

d) Empleando la fórmula (9), moda = 668.7 Empleando la fórmula (10), moda = 694.9. 

3.88 a) 8.4; b) 4.23. 

3.89 a)G =8; b) X = 12.4. 

3.90 a) 4.14; b) 45.8. 

3.91 a) 11.07 tons; Ib) 499.5. 

3.92 18.9%. 

3.93 a) 1.01%; b ) 238.2 millones; c) 276.9 millones. 

3.94 $1 586.87. 

3.95 $1 608.44. 

3.96 3.6 y 14.4. 

3.97 a) 3.0; b) 4.48. 

3.98 a) 3; b) 0; c) 0. 

3.100 a) 11.04; b) 498.2. 

3.101 38.3 mi/h. 

3.102 b) 420 mi/h. 
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3.104 a) 25; b) 3.55. 

3.107 a) Cuartil inferior = Q 1 = 67, cuartil intermedio = Q 2 = mediana = 75 y cuartil superior = Q 3 = 83. 

b ) 25% obtuvo 67 o menos (o 75% obtuvo 67 o más), 50% obtuvo 75 o menos (o 50% obtuvo 75 o más) y 75% obtuvo 83 
o menos (o 25% obtuvo 83 o más). 

3.108 a) Oj = 10.55 tons, Q 2 = 11.07 tons y Q 3 = 11.57 tons; b)Q 1 = 469.3, Q 2 = 490.6 y Q 3 = 523.3. 

3.109 M edia aritmética, mediana, moda, Q 2 , P 50 y D 5 . 

3.110 a) 10.15 tons; b ) 11.78 tons; c) 10.55 tons; d) 11.57 tons. 

3.112 a) 83; b) 64. 

CAPÍTULO 4 

4.33 a) 9; b) 4.273. 

4.34 4.0 tons. 

4.35 0.0036 cm. 

4.36 7.88 kg. 

4.37 20 semanas. 

4.38 a) 18.2; b) 3.58; c) 6.21; d) 0; e) \fl = 1.414 aproximadamente; f) 1.88. 

4.39 a) 2; b) 0.85. 

4.40 a) 2.2; b) 1.317. 

4.41 0.576 ton. 

4.42 a) 0.00437 cm; b) 60.0%, 85.2% y 96.4%. 

4.43 a) 3.0; b) 2.8. 

4.44 a) 31.2; b) 30.6. 

4.45 a) 6.0; b) 6.0. 

4.46 4.21 semanas. 

4.48 a) 0.51 ton; b) 27.0; c) 12. 

4.49 3.5 semanas. 

4.52 a) 1.63 tons; b) 33.6 o 34. 

4.53 El rango percentil 10-90 es igual a $189 500 y el 80% de los precios de venta se encuentran en el intervalo $130 250 ± 
$94 750. 

4.56 a) 2.16; b) 0.90; c) 0.484. 
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4.58 45. 

4.59 a) 0.733 ton; b) 38.60; c) 12.1. 

4.61 a) X = 2.47; b) s = 1.11. 

4.62 s = 5.2 y rango/4 = 5. 

4.63 a) 0.00576 cm; b ) 72.1%, 93.3% y 99.76%. 

4.64 a) 0.719 ton; b) 38.24; c) 11.8. 

4.65 a) 0.000569 cm; b) 71.6%, 93.0% y 99.68%. 

4.66 a) 146.8 Ib y 12.9 Ib. 

4.67 a) 1.7349 cm y 0.00495 cm. 

4.74 a) 15; b) 12. 

4.75 a) Estadística; b) álgebra. 

4.76 a) 6.6%; b ) 19.0%. 

4.77 0.15. 

4.78 0.20. 

4.79 Álgebra. 

4.80 0.19, —1.75,1.17, 0.68, —0.29. 


CAPÍTULO 5 

5.15 a) 6; b) 40; c) 288; d) 2 188. 

5.16 a) 0; b) 4; c) 0; cf) 25.86. 

5.17 a) -1; b) 5; c) -91; d) 53. 

5.19 0,26.25,0,1 193.1. 

5.21 7. 

5.22 a) 0, 6,19, 42; b) -4, 22, -117, 560; c) 1, 7, 38,155. 

5.23 0,0.2344,-0.0586,0.0696. 

5.25 a) m - 1 = 0, b) m 2 = pq ; c) m 3 = pq(q - p); d) m 4 = pq(p 2 - pq + q 2 ). 

5.27 m l = 0, m 2 = 5.97, m 3 = -0.397, m 4 = 89.22. 


5.29 (corregido) = 0, m 2 (corregido) = 5.440, m 3 (corregido) = -0.5920, m 4 (corregido) = 76.2332. 
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5.30 a) mj = 0, m 2 = 0.53743, m 3 = 0.36206, m 4 = 0.84914; 

b) m 2 (corregido) = 0.51660, m 4 (corregido) = 0.78378. 

5.31 a) 0; b) 52.95; c) 92.35; d) 7 158.20; e) 26.2; f) 7.28; g) 739.58; h) 22 247; /) 706 428; 
/) 24 545. 

5.32 a) -0.2464; b) -0.2464. 

5.33 0.9190. 

5.34 La primera distribución. 

5.35 a) 0.040; b) 0.074. 

5.36 a) —0.02; Jb) —0.13. 



Distribución 

Coeficiente de asimetría (o sesgo) dePearson 

1 

2 

3 

Primer coeficiente 

0.770 

1 

-0.770 

Segundo coeficiente 

1.094 

0 

-1.094 


5.38 a) 2.62;b)2.58. 

5.39 a) 2.94; b) 2.94. 

5.40 a) La segunda; b) la primera. 

5.41 a) La segunda; b) ninguna; c) la primera. 

5.42 a) M ayor que 1 875; b) igual a 1 875; c) menor que 1 875. 

5.43 a) 0.313. 


CAPÍTULO 6 


6.40 a) b) C) 0.98; d) f; e) 2 

6.41 a) Probabilidad de obtener un rey en la primera extracción, pero no en la segunda extracción. 

b ) Probabilidad de obtener un rey, ya sea en la primera extracción, en la segunda extracción o en ambas. 

c) No obtener rey en la primera extracción o no obtener rey en la segunda o en ninguna (es decir, no obtener rey ni en la 
primera extracción ni en la segunda extracción). 

d) Probabilidad de obtener un rey en la tercera extracción dado que se obtuvo rey en la primea extracción pero no en la 
segunda extracción. 

e) N o obtener rey en la primera ni en la segunda ni en la tercera extracción. 

f) Probabilidad de obtener rey en la primera y en la segunda extracción o no obtener rey en la segunda extracción pero sí 
en la tercera extracción. 


6.42 

6.43 


6.44 


a) i; b) §; C) 2i; d) f; e) % 

a) A; b) A; C) if; d) 2 6 ¿; e) ±±; f) i; g) h) /) A; j) ¿ 2 5 . 
a) 1; b) A; c) {if; d) §; e) |1; f) i; g) 1; h) ig; /) & j) 
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6.45 a) , 5 r ; b) & c) 

6.46 a) g; b) C) £ d) % e) §£ f) |§; g) f; b) & 

6.47 A 

6.48 a) 81:44; b) 21:4. 


6.49 if. 

6.50 a) §; b) i; C) d) {§. 

6.51 a) 37.5%; b) 93.75%; c) 6.25%; d) 68.75%. 


6.52 

a) 

X 

0 

i 

2 

3 

4 



P(X) 

1 

16 

4 

16 

6 

16 

4 

16 

1 

16 

6.53 

a) 

& b ) c > 

3 . 

4 ’ 6 - 





6.54 

a) 

X 

0 

i 

2 

3 




P(X) 

1 

6 

1 

2 

3 

10 

1 

30 



X 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

P(X)* 

1 

3 

6 

10 

15 

21 

25 

27 

27 

25 

21 

15 

10 

6 

3 

1 


♦Todos los valores de p(x) tienen un divisor de 216. 


b ) 0.532407. 

6.56 $9. 

6.57 $4.80 por día. 

6.58 A contribuye con $12.50; B contribuye con $7.50. 

6.59 a) 7; b) 590; c) 541; d ) 10 900. 

6.60 a) 1.2; b) 0.56; c) \/0.56 = 0.75 aproximadamente. 

6.63 10.5. 

6.64 a) 12; b) 2 520; c) 720; 

d )= P E R MUÍ(4,2), =P E RMUT(7,5), =PERMUT(10, 3) 

6.65 n = 5. 

6.66 60. 

6.67 a) 5 040; b) 720; c) 240. 

6.68 a) 8 400; Ib) 2 520. 


6.69 


a) 32 805; b ) 11 664. 
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6.70 

6.71 

6.72 

6.73 

6.74 

6.75 

6.76 

6.77 

6.78 

6.79 
6.81 

6.83 

6.84 

6.85 

6.86 

6.87 

6.90 

6.91 

6.92 

6.93 

6.94 

6.95 


26. 


a) 120; b) 72; c) 12. 
a) 35; b) 70; c) 45. 

d) =C0MBI N(7, 3), =C0MBI N( 8, 4) , =C0MBI N(10, 8) 
n = 6. 

210 . 

840. 

a) 42 000; b ) 7 000. 
a) 120; b) 12 600. 
a) 150; b) 45; c) 100. 
a) 17; b) 163. 

2.95 x 10 25 . 


6 í-»\ 22 . ^v 169 . 

a) 5 525’ ^ 425’ 425’ 


d) 


73 

5 525* 


171 
1 296* 


a) 0.59049; b) 0.32805; c) 0.08866. 


b) ¡; c) l 


a) 8; b) 78; c) 86; d) 102; e) 20:7)142. 


I 

3* 


1/3 838 380 (es decir, las posibilidades en contra de ganar son 3 838 379 contra 1). 


a) 658 007 a 1; b) 91 389 a 1; c) 9 879 a 1. 


a) 649 739 a 1; b) 71192 a 1; c) 4 164 a 1; d) 693 a 1. 


11 

36* 


1 

4‘ 


X 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

p(X)* 

1 

3 

6 

10 

12 

12 

10 

5 

3 

1 


♦Todos los valores de p(x) tienen un divisor de 64. 

6.97 7.5 


6.98 


70%. 
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6.99 

6.100 


(0.5) (0.01) + (0.3K0.02) + (0.2) (0.03) = 0.017. 
= 0.35. 

0.017 


CAPITULO 7 


7.35 

7.36 

7.37 


a) 5 040; b) 210; c) 126; d) 165; e) 6. 

a) q 1 + 7 q 6 p + 21q 5 p 2 + 35q 4 p 3 + 35q 3 p 4 + 21 g 2 p 5 + Iqp 6 + p 7 

b) g 10 + 10q 9 p + 45q 8 p 2 + 120q 7 p 3 + 210q 6 p 4 + 252q 5 p 5 + 210q 4 p 6 + 120g 3 p 7 + 45p 2 p 8 + 10gp 9 + p 10 

a ) ¿ > 6) ¿ si ; n ; si ; O ¿ ; 9) ¿; 

h) Función de densidad de probabilidad 

Binomial with n = 6 and p = 0.5 


X 

0 

1 

2 

3 

4 

5 

6 


P (X = x ) 

0.015625 

0.093750 

0.234375 

0.312500 

0.234375 

0.093750 

0.015625 


7.38 

7.39 

7.40 

7.41 

7.42 

7.43 

7.44 


a )g;6)i; 

c) l-BI N0MDI ST( 1, 6, 0. 5, 1) o bien 0.8 9 0 6 2 5, =BI N0MDI ST( 3, 6, 0. 5, 1) = 0.6 5 6 2 5. 
a) i; b) | 5 6 ; C){i; d) f. 
a) 250; b) 25; c) 500. 

a ) TS2’ 354' 

64 

243* 

193 

512- 


e) 

a 

5 

c 

d 


b) 




243 ’ 


0.131691 

0.790128 

0.164606 

0.995885 


=BINOMDIST(5,5,0.66667,0) 
=l-BINOMDIST(2,5,0.66667,1) 
=BINOMDIST(2,5,0.66667,0) 

= l-BINOMDIST (0,5,0.66667,0 ). 


7.45 

7.47 

7.49 


a) 42; b) 3.550; c) -0.1127; d) 2.927. 
a) A/pq(q - p); b) Npq(l - 6pg) + 3/V 2 p 2 g 2 . 
a) 1.5 y-1.6; ib) 72 y 90. 


7.50 


a) 75.4; b) 9. 
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7.51 

a) 

0.8767; 

b) 

0.0786; c) 0.2991; 


d) 







a 


0 . 

.8767328 



b 


0 . 

.0786066 



c 


0 . 

.2991508 

7.52 

a) 

0.0375; 

b) 

0.7123; c) 0.9265; 


9) 







a 


0 . 

.037538 



h 


0 . 

. 7122603 



c 


0 . 

.9264707 



d 


0 . 

.0153863 



e 


0 . 

. 7251362 



f 


0 . 

.0394927 

7.53 

a) 

0.9495; 

b) 

0.9500; c) 0.6826. 

7.54 

a) 

0.75; b) 

_ 

1.86 

; c) 2.08; d) 1. 


=NORMSDIST(2.4)-NORMSDIST(-1.2) 
=NORMSDIST(1.87)-NORMSDIST(1.23) 
=NORMSDIST (-0.5 )-NORMSDIST (-2.35). 


=NORMSDIST(-1.78) 

=NORMSDIST(0.56) 

=l-NORMSDIST(-1.45) 

=l-NORMSDIST(2.16) 

=NORMSDIST(1.53)-NORMSDIST(-0.8) 
=NORMSDIST ( -2.52 ) + ( 1-NORMSDIST (1.83)). 


7.55 


-0.995. 


7.56 a) 0.0317; b) 0.3790; c) 0.1989; 

d ) 

a 0.03174 =NORMDIST(2.25,0,1,0) 

b 0.37903 =NORMDIST(-0.32,0,1,0) 

c 0.19886 =NORMDIST(-l. 18,0,1,0). 

7.57 a) 4.78%; b) 25.25%; c) 58.89%. 

7.58 a) 2.28%; b) 68.27%; c) 0.14%. 


7.59 84. 


7.60 a) 61.7%; b) 54.7%. 

7.61 a) 95.4%; b) 23.0%; c) 93.3%. 

7.62 a) 1.15; b) 0.77. 

7.63 a) 0.9962; b) 0.0687; c) 0.0286; d) 0.0558. 

7.64 a) 0.2511; b) 0.1342. 

7.65 a) 0.0567; b) 0.9198; c) 0.6404; d) 0.0079. 

7.66 0.0089. 


7.67 a) 0.04979; b) 0.1494; c) 0.2241; c() 0.2241; e) 0.1680; f) 0.1008. 

7.68 a) 0.0838; b) 0.5976; c) 0.4232. 

7.69 a) 0.05610; b) 0.06131. 

7.70 a) 0.00248; b) 0.04462; c) 0.1607; d) 0.1033; e) 0.6964; f) 0.0620. 
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7.71 a) 0.08208; b ) 0.2052; c) 0.2565; d) 0.2138; e) 0.8911; f) 0.0142. 

7-72 a) yggg; b) 354. 

7.73 a) 0.0348; b) 0.000295. 

7 74 — 

7.75 p(X) = (^.)(0.32) z (0.68) 4 ^. Las frecuencias esperadas son 32, 60, 43,13 y 2, respectivamente. 

7.76 


Histograma 
15 ■ 



Horas 


El histograma muestra un sesgo en los datos, lo que indica que no hay normalidad. 
La prueba de Shapiro-Wilt de STATISTIX indica que no hay normalidad. 

7.77 El histograma de STATISTIX indica claramente normalidad. 


Histograma 



8 9 10 11 12 13 14 15 16 17 18 19 20 

Horas 
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Con la secuencia “Statistics => Randomness/Normality Tests => Normality Probability Plot" se obtiene la gráfica 
siguiente. Si los datos provienen de una población distribuida normalmente, los puntos de la gráfica tienden a caer en una 
línea recta y P(1/1/) tiende a ser mayor que 0.05. Si P(1/1/) < 0.05, por lo general se rechaza que haya normalidad. 


Gráfica de horas de probabilidad normal 


18 - 


16 


"O 

Vh 

O 


14 


12 - 


10 



- 2-1012 

Puntuaciones 

30 casos Shapiro-Wil, W 0.9768 P(W) 0.7360 


Arriba se muestra la gráfica para probabilidad normal. Se muestra el estadístico de Shaplro-Wilk junto con el valor p. 
P(1/1/) = 0.7360. Como el valor p es considerablemente mayor que 0.05, no se rechaza la normalidad de los datos. 


7.78 El siguiente hlstograma de las puntuaciones de examen de la tabla 7.11, obtenido con STATISTIX, tiene forma de U. Por 
lo tanto, se le conoce como distribución en forma de U. 


Histograma 



0 10 20 30 40 50 60 70 80 90 100 

Puntuaciones 












Respuestas a los problemas suplementarios 519 


Esta gráfica se obtiene con la secuencia "Statistics => Randomness/Normality Tests => Normality Probability Plot". Si 

los datos provienen de una población distribuida normalmente, los puntos de la gráfica tienden a caer en una línea recta y 
P (1/1/) tiende a ser mayor que 0.05. Si P (1/1/) < 0.05, por lo general se rechaza que haya normalidad. 


Gráfica de probabilidad normal para las puntuaciones 



- 2-1012 

Puntuaciones 

30 casos Shapiro-Wilk, W 0.8837 P(W) 0.0034 


Arriba se muestra la gráfica para probabilidad normal. Se muestra el estadístico de Shapiro-Wilk junto con el valor p P (l/l/) 
= 0.0034. Como el valor p es menor que 0.05, se rechaza la normalidad de los datos. 

7.79 Además de la prueba de Kolgomorov-Smirnov de M INITAB y de la prueba de Shapiro-Wilk deSTATISTIX, hay otras dos 
pruebas para la normalidad, que se verán aquí. Éstas son la prueba de Ryan-Joiner y la prueba de Anderson-Darling. 
Básicamente las cuatro pruebas calculan un estadístico de prueba y cada estadístico tiene un correspondiente valor p. Por 
lo general se sigue la regla siguiente. Si el valor pe s < 0.05, se rechaza la normalidad. La gráfica siguiente se obtiene al 
hacer la prueba de Anderson-Darling. En este caso, el valorp es 0.006 y se rechazará la hipótesis de que los datos provienen 
de una distribución normal. 


Gráfica de probabilidad de puntuaciones 


Normal 
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Obsérvese que si se emplea la prueba de Ryan-Joiner no se rechaza la normalidad. 


Gráfica de probabilidad de puntuaciones 

Normal 



ÍO 0.61 

7.80 p(X) = ——— -. Las frecuencias esperadas son 108.7, 66.3, 20.2, 4.1 y 0.7, respectivamente. 

Á .! 

CAPÍTULO 8 

8.21 a) 9.0; ib) 4.47; c) 9.0; c/) 3.16. 

8.22 a) 9.0; ib) 4.47; c) 9.0; d) 2.58. 

8.23 a) = 22.40 g, a x = 0.008 g; b) nx = 22.40 g, a x = un poco menos de 0.008 g. 

8.24 a) nx = 22.40 g, a x = 0.008 g; b) p x = 22.40 g, a x = 0.0057 g. 

8.25 a) 237; b) 2; c) ninguna; d) 34. 

8.26 a) 0.4972; b) 0.1587; c) 0.0918; d) 0.9544. 

8.27 a) 0.8164; b) 0.0228; c) 0.0038; d) 1.0000. 

8.28 0.0026. 

8.34 a) 0.0029; b) 0.9596; c) 0.1446. 

8.35 a) 2; b) 996; c) 218. 

8.36 a) 0.0179; b) 0.8664; c) 0.1841. 

8.37 a) 6; b) 9; c) 2; d) 12. 

8.39 a) 19; b) 125. 

8.40 a) 0.0077; b) 0.8869. 
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8.41 a) 0.0028; b ) 0.9172. 

8.42 a) 0.2150; b ) 0.0064; c) 0.4504. 

8.43 0.0482. 

8.44 0.0188. 

8.45 0.0410. 

8.47 a) 118.79 g; b) 0.74 g. 

8.48 0.0228. 

8.49 /x = 12 y a 2 = 10.8. 


A 

B 

C 

D 

p r i me r a 

segunda 

me di a 

probabilidad 

6 

6 

6 

0.01 

6 

9 

7.5 

0.02 

6 

12 

9 

0.04 

6 

15 

10.5 

0.02 

6 

18 

12 

0.01 

9 

6 

7.5 

0.02 

9 

9 

9 

0.04 

9 

12 

10.5 

0.08 

9 

15 

12 

0.04 

9 

18 

13.5 

0.02 

12 

6 

9 

0.04 

12 

9 

10.5 

0.08 

12 

12 

12 

0.16 

12 

15 

13.5 

0.08 

12 

18 

15 

0.04 

15 

6 

10.5 

0.02 

15 

9 

12 

0.04 

15 

12 

13.5 

0.08 

15 

15 

15 

0.04 

15 

18 

16.5 

0.02 

18 

6 

12 

0.01 

18 

9 

13.5 

0.02 

18 

12 

15 

0.04 

18 

15 

16.5 

0.02 

18 

18 

18 

0.01 


1 


8.50 Distribución de probabilidad deX-barra para n =2. 


D E F 

probabilidad xbarra 

G 

p(xbar r a) 


H 

0. 01 

6 

0. 01 

D2 

0. 02 

7. 5 

0. 04 

D3+D7 
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0.04 

9 

0.12 

D4+D8+D12 

0.02 

10.5 

0.2 

D5+D9+D13+D17 

0.01 

12 

0.26 

D6+D10+D14+D18+D22 

0.02 

13.5 

0.2 

D11+D15+D19+D23 

0.04 

15 

0.12 

D16+D20+D24 

0.08 

16.5 

0.04 

D21+D25 

0.04 

18 

0.01 

D26 

0.02 


1 

SUM(G2:G10) 


0.04 

0.08 

0.16 

0.08 

0.04 

0.02 

0.04 

0.08 

0.04 

0.02 

0.01 

0.02 

0.04 

0.02 

0.01 



8.51 M edia(x-barra) = 12 Var (x-barra) = 5.4. 


8.52 


x b a r r a 
6 
7 


P (x b a r r a' 
0 . 001 
0. 006 
0. 024 
0. 062 


9 
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10 

0.123 

11 

0.18 

12 

0.208 

13 

0.18 

14 

0.123 

15 

0.062 

16 

0.024 

17 

0.006 

18 

O.OOl 



CAPÍTULO 9 

9.21 a) 9.5 kg; b) 0.74 kg 2 ; c) 0.78 kg y 0.86 kg, respectivamente. 

9.22 a) 1 200 h; b) 105.4 h. 

9.23 a) Las estimaciones de las desviaciones estándar con muestras de tamaño 30, 50 y 100 cinescopios son 101.7 h, 101.0 h y 

100.5 h, respectivamente; las estimaciones de las medias poblacionales son 1 200 h en todos los casos. 

9.24 a) 11.09 ± 0.18 tons; b) 11.09 ± 0.24 tons. 

9.25 a) 0.72642 ± 0.000095 in; b) 0.72642 ± 0.000085 in; c) 0.72642 ± 0.000072 ¡n; d) 0.72642 ± 0.000060 in. 

9.26 a) 0.72642 ± 0.000025 in; b) 0.000025 in. 

9.27 a) Por lo menos 97; b) por lo menos 68; c) por lo menos 167; d) por lo menos 225. 

9.28 Intervalo de confianza de 80% para la media: (286.064, 332.856). 

9.29 a) 2 400 ± 45 Ib, 2 400 ± 59 Ib; b) 87.6%. 

9.30 a) 0.70 ± 0.12, 0.69 ± 0.11; b) 0.70 ± 0.15, 0.68 ± 0.15; c) 0.70 ± 0.18, 0.67 ± 0.17. 
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9.31 Intervalo de confianza de 97.5% para la diferencia: (0.352477, 0.421523). 

9.32 a) 16 400; b) 27 100; c) 38 420; d) 66 000. 

9.33 a) 1.07 ± 0.09 h; b) 1.07 ± 0.12 h. 

9.34 Intervalo de confianza de 85% para la diferencia: (-7.99550, -0.20948). 

9.35 Intervalo de confianza de 95% para la diferencia: (-0.0918959, -0.00610414). 

9.36 a) 180 ± 24.9 Ib; b) 180 ± 32.8 Ib; c) 180 ± 38.2 Ib. 

9.37 

One Sample Chi-square Test for a Variance 
Sample Statistics for volume 


N 

Mean 

Std. Dev. 

Variance 

20 

180.65 

1.4677 

2.1542 


99% Conñdence Interval for the variance 
Lower Limit Upper Limit 

1.06085 5.98045 

9.38 

Two Sample Test for variances of units within line 
Sample Statistics 
line 


Group 

N 

Mean 

Std. Dev. 

Variance 

1 

13 

104.9231 

12.189 

148.5769 

2 

15 

101.2667 

5.5737 

31.06667 


95% Conñdence Interval of the Ratio of Two Variances 


Lower Limit Upper Limit 


1.568 15.334 


CAPÍTULO 10 
10.29 a) 0.2604. 

b )_ 0.1302 _|_ Zona de aceptación _ | 0,1302 

0 27 37 


64 


« = 0.1302 + 0.1302. 
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10.30 a) Rechazar la hipótesis nula si X < 21 oX > 43, dondeX = número de canicas rojas extraídas; b ) 0.99186; c) rechazar si 

X < 23 o X >41. 

10.31 a) H 0 : p = 0.5 H a : p > 0.5; b ) prueba de una cola; c) rechazar la hipótesis nula si X > 40; d) rechazar la hipótesis nula si 

X > 41. 

10.32 a) Para dos colas, valorp = 2 * ( 1 - BI NOMDI S T ( 2 2, 100, 0. 16666, 1) = 0.126 > 0.05. Al nivel de significancia 0.05, 

no se rechaza la hipótesis nula. 

b) Para una cola, val or p = 1 - BI NOMDI ST( 22, 100, 0. 16666, 1) = 0.063 > 0.05. Al nivel de significancia 0.05, no 
se rechaza la hipótesis nula. 

10.33 Empleando ya sea una prueba de una cola o una prueba de dos colas, al nivel de significancia 0.01 no se puede rechazar la 
hipótesis. 

10.34 H 0 :p> 0.95 H a : p < 0.95 

Valor p = P{X <182 de 200 piezas cuando p = 0.95} = BI NOMDI ST( 182, 200, 0. 95, 1) = 0.012. No se rechaza a 
0.01, pero se rechaza a 0.05 

10.35 Estadístico de prueba = 2.63, valores críticos ±1.7805, se rechaza la hipótesis nula. 

10.36 Estadístico de prueba = -3.39, valor crítico para 0.10 es -1.28155, valor crítico para 0.025 es -1.96. El resultado es 
significativo a a = 0.10 y a = 0.025. 

10.37 Estadístico de prueba = 6.46, valor crítico = 1.8808, se concluye que p > 25.5. 

10.38 =N0RMSI NV( 0. 9) = 1.2815 para a = 0.1, =N0RM51 NV( 0. 99) = 2.3263 para a = 0.01 y =N0RMSI NV( 0. 9 9 9) 
= 3.0902 para a = 0.001. 

10.39 valor p = P {X < 3} + P {X > 12} = 0.0352. 

10.40 valor p = P{Z< -2.63} +P{Z> 2.63} = 0.0085. 

10.41 valorp =P{Z< -3.39} = 0.00035. 

10.42 valor p = P{Z> 6.46} = 5.23515E-11. 

10.43 a) 8.64 ± 0.96 oz; b) 8.64 ± 0.83 oz; c) 8.64 ± 0.63 oz. 

10.44 Los límites superiores de control son: a) 12 y b) 10. 

10.45 Estadístico de prueba = -5.59, valor p = 0.000. Se rechaza la hipótesis nula ya que el valorp < a. 

10.46 Estadístico de prueba = -1.58, valor p = 0.059. Para a = 0.05 no se rechaza, para a = 0.10 sí se rechaza. 

10.47 Estadístico de prueba = -1.73, valor p = 0.042. Para a = 0.05 se rechaza, para a = 0.01 no se rechaza. 

10.48 Con una prueba de una cola se observa que, a ambos niveles de significancia, el nuevo fertilizante es mejor. 

10.49 a) Estadístico de prueba = 1.35, valor p = 0.176, no se puede rechazar la hipótesis nula a a = 0.05. 
b) Estadístico de prueba = 1.35, valor p = 0.088, no se puede rechazar la hipótesis nula a a = 0.05. 

10.50 a) Estadístico de prueba = 1.81, valor p = 0.07, no se puede rechazar la hipótesis nula a a = 0.05. 
b ) Estadístico de prueba = 1.81, valor p = 0.0035, se rechaza la hipótesis nula a a = 0.05. 

10.51 =1-BI NOMDI ST( 10, 15, 0. 5, 1) o bien 0.059235. 
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10.52 =BI NOMDI ST ( 2, 2 0, 0. 5, 1) +1- Bl NOMDI 5T( 17, 2 0, 0. 5, 1) o 0.000402. 

10.53 =BI NOMDI ST ( 1 0, 1 5, 0 . 6, 1) 0 0.7827. 

10.54 =BI NOMDI ST ( 17, 2 0 , 0 . 9 , 1) - BI NOMDI ST( 2, 2 0, 0 . 9, 1) 0 0.3231. 

10.55 El valor p se obtiene con =1 - BI NOMDI S T ( 9, 15, 0. 5, 1) que da 0.1509. No se rechaza la hipótesis nula porque el valor 

de a = 0.0592 y el valor p no es menor que a. 

10.56 a=BI NOMDI ST( 4, 20, 0. 5, 1) +1-BI NOMDI ST( 15, 20, 0. 5, 1) o bien 0.0118 
valorp=BI NOMDI ST( 3, 20, 0. 5, 1) +1-BI NOMDI ST( 16, 20, 0. 5, 1) o bien 0.0026. 

Se rechaza la hipótesis nula dado que el valor p < a. 

10.57 =1 - BI NOMDI ST ( 3, 3 0, 0. 0 3, 1) o bien 0.0119. 

10.58 =BI NOMDI ST( 3, 3 0, 0. 0 4, 1) o bien 0.9694. 

10.59 q= 1- Bl NOMDI ST( 5, 2 0, 0. 1 6 6 6 7, 1 ) o bien 0.1018 

valorp =1- Bl NOMDI ST( 6, 2 0, 0. 1 6 6 6 7, 1 ) o bien 0.0371. 

CAPÍTULO 11 

11.20 a) 2.60; b) 1.75; c) 1.34; d) 2.95; e) 2.13. 

11.21 a) 3.75; b ) 2.68; c) 2.48; d) 2.39; e) 2.33. 

a) =TI NV( 0. 0 2, 4) o bien 3.7469; b ) 2.6810; c) 2.4851; d) 2.3901; e) 3.3515. 

11.22 a) 1.71; b) 2.09; c) 4.03; d) -0.128. 

11.23 a) 1.81; b ) 2.76; c) -0.879; d) -1.37. 

11.24 a) ±4.60; b) ±3.06; c) ±2.79; d) ±2.75; e) ±2.70. 

11.25 a) 7.38 ± 0.79; b) 7.38 ± 1.11. 

c)( 6. 5 9 2 1 4, 8. 1 6 7 8 6 )( 6. 2 6 8 2 5, 8,4 9 1 7 5 ) . 

11.26 a) 7.38 ±0.70; Ib) 7.38 ±0.92. 

11.27 a) 0.289 ± 0.030 segundos; b ) 0.298 ± 0.049 segundos. 

11.28 Con una prueba de dos colas se observa que no hay evidencia, ni al nivel 0.05 ni al nivel 0.01, que indiquen que el tiempo 
medio de vida ha variado. 

11.29 Con una prueba de una cola se observa que no hay disminución en la media al nivel 0.05 ni al nivel 0.01. 

11.30 Con una prueba de dos colas se observa que el producto no satisface las especificaciones requeridas. 

11.31 Con una prueba de una cola se observa, a ambos niveles, que el contenido de cobre es superior al requerido por las especi¬ 
ficaciones. 

11.32 Con una prueba de una cola se observa que la nueva máquina debe introducirse si el nivel de significancia que se adopte es 
0.01, pero no debe introducirse si el nivel de significancia que se adopte es 0.05. 

11.33 Con una prueba de una cola se observa que la marca/f es mejor que la marca 6 al nivel de significancia 0.05. 
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11.34 Empleando una prueba de dos colas, al nivel de significancia 0.05, de acuerdo con las muestras no se puede concluir que 
haya diferencia entre la acidez de las dos soluciones. 

11.35 Empleando una prueba de una cola, al nivel de significancia 0.05 se concluye que el primer grupo no es mejor que el 
segundo. 

11.36 a) 21.0; b) 26.2; c) 23.3; d) =CHI I NV( 0. 05,12) o bien 21.0261 =CHI I NV( 0. 01,12) o bien 26.2170 

=CHI I NV( 0. 0 2 5, 1 2 ) o bien 23.3367. 

11.37 a) 15.5; b) 30.1; c) 41.3; cf) 55.8. 

11.38 a) 20.1; b) 36.2; c) 48.3; cf) 63.7. 

11.39 a) X? — 9.59 y xí 34.2. 

11.40 a) 16.0; b ) 6.35; c) suponiendo áreas ¡guales en ambas colas, xí = 2.17 y xí = 14.1. 

11.41 a) 87.0 a 230.9 h; b) 78.1 a 288.5 h. 

11.42 a) 95.6 a 170.4 h; b) 88.9 a 190.8 h. 

11.43 a) 122.5; b) 179.2; c) =CHI I NV( 0. 9 5, 1 5 0 ) o bien 122.6918; cf) =CHI I NV( 0. 0 5, 1 5 0 ) o bien 179.5806. 

11.44 a) 207.7; b ) 295.2; c) =CHl I NV( 0. 9 7 5, 2 5 0 ) o bien 208.0978; cf) =CHI I NV( 0. 0 2 5, 2 5 0 ) o bien 295.6886. 

11.46 a) 106.1 a 140.5 h; b) 102.1 a 148.1 h. 

11.47 105.5 a 139.6 h. 

11.48 Con base en las muestras dadas, el aparente aumento de la variabilidad no es significativo a ninguno de los dos niveles. 

11.49 La disminución aparente de la variabilidad es significativa al nivel 0.05, pero no al nivel 0.01. 

11.50 a) 3.07; ó) 4.02; c) 2.11; cf) 2.83. 

11.51 a) =FI NV( 0. 0 5, 8, 10) o bien 3.0717; ó) =F I NV( 0. 01, 24, 11) o bien 4.0209; 

c) =FI NV( 0. 0 5, 1 5, 2 4 ) o bien 2.1077; cf) =F I NV( 0. 0 1, 2 0, 2 2 ) o bien 2.8274. 

11.52 AI nivel 0.05, la varianza de la muestra 1 es significativamente mayor, pero al nivel 0.01, no. 

11.53 a) Sí; b) no. 

CAPÍTULO 12 

12.26 La hipótesis no puede rechazarse a ninguno de los dos niveles. 

12.27 La conclusión es la misma que antes. 

12.28 El nuevo profesor no sigue el patrón de notas de los otros profesores. (El que las notas sean mejores que el promedio puede 
deberse a una mejor capacidad para enseñar o a un estándar inferior, o ambas cosas.) 
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12.29 N o hay razón para rechazar la hipótesis de que la moneda no esté cargada. 

12.30 No hay razón para rechazar la hipótesis a ninguno de los dos niveles. 

12.31 a) 10, 50 y 60, respectivamente; 

b ) al nivel de significancia 0.05 no se puede rechazar la hipótesis de que los resultados sean los esperados. 

12.32 Al nivel de significancia 0.05, la diferencia es significativa. 

12.33 a) El ajuste es bueno; ó) no. 

12.34 a) El ajuste es "muy bueno"; b ) al nivel 0.05, el ajuste no es bueno. 

12.35 a) AI nivel 0.05 el ajuste es muy malo; dado que la distribución binomial da un buen ajuste a los datos, esto coincide con 

el problema 12.33. 

b) El ajuste es bueno, pero no "muy bueno". 

12.36 Al nivel 0.05 se puede rechazar la hipótesis, pero no al nivel 0.01. 

12.37 La conclusión es la misma que antes. 

12.38 La hipótesis no se puede rechazar a ninguno de los dos niveles. 

12.39 La hipótesis no se puede rechazar al nivel 0.05. 

12.40 La hipótesis se puede rechazar a los dos niveles. 

12.41 La hipótesis se puede rechazar a los dos niveles. 

12.42 La hipótesis no se puede rechazar a ninguno de los dos niveles. 

12.49 a) 0.3863 (no corregido) y 0.3779 (con la corrección deYate). 

12.50 a) 0.2205, 0.1985 (corregido); b) 0.0872, 0.0738 (corregido). 

12.51 0.4651. 

12.54 a) 0.4188, 0.4082 (corregido). 

12.55 a) 0.2261, 0.2026 (corregido); b) 0.0875, 0.0740 (corregido). 

12.56 0.3715. 

CAPÍTULO 13 

13.24 a)4;b)6;c)f; cf) 10.5; e) 6; f) 9. 

13.25 (2,1). 

13.26 a) 2X + Y = 4; b) Intersección con el ejeX = 2, Intersección con el eje Y = 4; c) -2, -6. 

Y = =X - 3 o bien 2X - 3Y = 9. 


13.27 
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13.28 a) Pendiente = |, intersección con el eje y = -4; b ) 3X - 5T = 11. 

13.29 a) - i; b) f; C) 4X + 3/ = 32. 

13.30 X/3 + Y /(—5) = 1 o bien 5X - 3Y = 15. 

13.31 a) °F = §°C +32; ó) 176°F;c) 20°C. 

13.32 a) Y = -i + fX, o bien / = -0.333 + 0.714X; b)X = 1+*Y, o bien X = 1.00+ 1.29/. 

13.33 a) 3.24; 8.24; ib) 10.00. 

13.35 b)Y = 29.13 + 0.661X; c) X = -14.39 + 1.15/; d) 79; e) 95. 

13.36 a) y ib). 


Gráfica de análisis de tendencia para la tasa de natalidad 
Modelo de tendencia lineal 
Y t = 14.3714-0.0571429* t 



o 


Año 

Tasa de natalidad 

Valor ajustado 

Residual 

1998 

14.3 

14.3143 

-0.014286 

1999 

14.2 

14.2571 

-0.057143 

2000 

14.4 

14.2000 

0.200000 

2001 

14.1 

14.1429 

-0.042857 

2002 

13.9 

14.0857 

-0,185714 

2003 

14.1 

14.0286 

0.071429 

2004 

14.0 

13.9714 

0.028571 


d) 14.3714-0.0571429(13) = 13.6. 
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13.37 a) y Ib) 


Gráfica de análisis de tendencia para el número 
Modelo de tendencia lineal 
Yf=3 951.43 + 156.357* t 



C) 


Año 

Número 

Valor ajustado 

Residual 

1999 

4 154 

4 107.79 

46.2143 

2000 

4 240 

4 264.14 

-24.1429 

2001 

4 418 

4 420.50 

-2.5000 

2002 

4 547 

4 576.86 

-29.8571 

2003 

4 716 

4 733.21 

-17.2143 

2004 

4 867 

4 889.57 

-22.5714 

2005 

5 096 

5 045.93 

50.0714 


d) 3 951.43 + 156.357(12) = 5 827.7. 


13.38 Y = 5.51 + 3.20(X - 3) + 0.733(X - 3) 2 o bien Y = 2.51 - 1.20X + 0.733X 2 . 


13.39 b) D = 41.77 - 1.0961/ + 0.087861/ 2 ; c) 170 ft, 516 ft. 
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13.40 


a) Gráfica de la recta ajustada 


Diferencia = -0.863 - 0.8725 tiempo codificado 



b) 


Gráfica cuadrática ajustada 
Diferencia = 1.215 - 3.098 tiempo codificado 



(C) 


Gráfica cúbica ajustada 

Diferencia = 0.6124 - 1.321 tiempo codificado 



Tiempo codificado 


Cf) 



M odelo lineal 

M odelo cuadrático 

M odelo cúbico 

Año 

Residual 

Ajustado 

Residual 

Ajustado 

Residual 

Ajustado 

1940 

1.363 

0.863 

-0.715 

1.215 

-0.112 

0.612 

1950 

0.836 

1.736 

0.649 

-1.549 

0.134 

-1.034 

1960 

-0.092 

0.092 

0.943 

-3.643 

0.330 

-3.030 

1970 

-1.919 

1.919 

-0.332 

-5.068 

-0.476 

-4.924 

1980 

-2.047 

2.047 

-0.575 

-5.825 

-0.139 

-6.261 

1990 

-1.074 

1.074 

-0.388 

-5.912 

0.292 

-6.592 

2000 

0.798 

6.098 

0.030 

-5.330 

0.162 

-5.462 

2005 

2.134 

6.534 

0.388 

-4.788 

-0.191 

-4.209 


SSQ = 

16.782 

SSQ = 

2.565 

SSQ = 

0.533 


e) 

Lineal: -0.863 - 0.8725(7) =-6.97 

Cuadrático: 1.215 - 3.098(7) + 0.3345(7 2 ) = -4.08 

Cúbico: 0.6124 - 1.321(7) - 0.4008(49) + 0.0754(343) = -2.41. 
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13.41 b ) Proporción = 0.965 + 0.0148 año codificado. 


Año 

Año 

codificado 

Hombre 

M ujer 

Proporción 

Valor 

ajustado 

Residual 

1920 

0 

53.90 

51.81 

0.96 

0.97 

-0.00 

1930 

1 

62.14 

60.64 

0.98 

0.98 

-0.00 

1940 

2 

66.06 

65.61 

0.99 

0.99 

-0.00 

1950 

3 

75.19 

76.14 

1.01 

1.01 

0.00 

1960 

4 

88.33 

90.99 

1.03 

1.02 

0.01 

1970 

5 

98.93 

104.31 

1.05 

1.04 

0.01 

1980 

6 

110.05 

116.49 

1.06 

1.05 

0.00 

1990 

7 

121.24 

127.47 

1.05 

1.07 

-0.02 


d) Proporción pronosticada = 1.08. Proporción real = 1.04. 

13.42 b) Diferencia = -2.63 + 1.35 x + 0.0064 xcuadrada. 

d ) La diferencia pronosticada para 1995 es -2.63 + 1.35(7.5) + 0.0064(56.25) = 7.86. 

13.43 b) Y = 32.14(1.427) x o bien Y = 32.14(10) 01544X o bien Y = 32.14e 03556x , dondee = 2.718--- es la base logarítmica natural. 
d) 387. 

CAPÍTULO 14 

14.40 b) Y = 4.000 + 0.500X; c) X = 2.408 + 0.6127. 

14.41 a) 1.304; b) 1.443. 

14.42 a) 24.50; b) 17.00; c) 7.50. 

14.43 0.5533. 

14.44 Usando EXCEL la solución es =C0RRE L ( A2: A11, B2: B11) que es 0.553. 

14.45 1.5. 

14.46 a) 0.8961; b) Y = 80.78 + 1.138X; c) 132. 

14.47 a) 0.958; b) 0.872. 

14.48 a) Y = 0.8X + 12; b) X = 0.457 + 1. 

14.49 a) 1.60; b) 1.20. 

















Respuestas a los problemas suplementarios 533 


14.50 ±0.80. 

14.51 75%. 

14.53 En los dos incisos se obtiene la misma respuesta, a saber -0.9203. 

14.54 a)Y = 18.04 - 1.34X, Y = 51.18 - 2.01X. 

14.58 0.5440. 

14.59 a) Y = 4.44X - 142.22; b) 141.9 Ib y 177.5 Ib, respectivamente. 

14.60 a) 16.92 Ib; b) 2.07 in. 

14.62 Correlación de Pearson entreCl y C2 = 0.957. 

14.63 Correlación de Pearson entreCl y C2 = 0.582. 

14.64 a) Sí; b) no. 

14.65 a) No; b) sí. 

14.66 a) 0.2923 y 0.7951; b) 0.1763 y 0.8361. 

14.67 a) 0.3912 y 0.7500; b) 0.3146 y 0.7861. 

14.68 a) 0.7096 y 0.9653; b) 0.4961 y 0.7235. 

14.69 a) Sí; b) no. 

14.70 a) 2.00 ± 0.21; b) 2.00 ± 0.28. 

14.71 a) Usando una prueba de una cola, se puede rechazar la hipótesis. 

b ) U sando una prueba de una cola, no se puede rechazar la hipótesis. 

14.72 a) 37.0 ± 3.28; b) 37.0 ± 4.45. 

14.73 a) 37.0 ± 0.69; b) 37.0 ± 0.94. 

14.74 a) 1.138 ± 0.398; b) 132.0 ± 16.6; c) 132.0 ± 5.4. 

CAPÍTULO 15 

15.26 a) X 3 = b 312 + b 312 X 3 + b 321 X 2 ; b) X 4 = t > 4 . 12 35 + ^ 41 . 235^1 + ^ 42 . 135^2 + ^ 43 . 125 ^ 3 - 

15.28 a) X 3 = 61.40 - 3.65Xj + 2.54X 2 ; b) 40. 

15.29 a) X 3 - 74 = 4.36(X 3 - 6.8) + 4.04(X 2 - 7.0) o bien X 3 = 16.07 ± 4.36X 3 + 4.04X 2 ; b) 84 y 66. 


15.30 En todos los casos se han resumido los resultados. 
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EXCEL 


Price 

Bedrooms 

Baths 

SUMMARY 

OUTPUT 


165 

3 

2 



200 

3 

3 

Regression Statistics 

225 

4 

3 

Múltiple R 

0.877519262 

180 

2 

3 

R Square 

0.770040055 

202 

4 

2 

Adjusted R Square 

0.704337213 

250 

4 

4 

Standard Error 

25.62718211 

275 

3 

4 

Observations 

10 

300 

5 

3 


Coefñcients 

155 

2 

2 

Intercept 

32.94827586 

230 

4 

4 

Bedrooms 

Baths 

28.64655172 

29.28448276 


MINITAB 

Análisis de regresión: precio contra recámaras, baños 

The regression equation is 

Price=32.9+28.6 Bedrooms+29.3 Baths 

R-Sq= 77.0% R-Sq(adj ) =70.4% 

SAS 

Root MSE 25.62718 R-Square 0.7700 

Dependent Mean 218.20000 Adj R-Sq 0.7 043 

Coeff Var 11.74481 

Parameter Estimates 


Variable 

Label 

DF 

Parameter 

Estimate 

Standard 

Error 

t Valué 

Pr > | t | 

Intercept 

Intercept 

1 

32.94828 

39.24247 

0.84 

0.4289 

Bedrooms 

Bedrooms 

1 

28.64655 

9.21547 

3.11 

0.0171 

Baths 

Baths 

1 

29.28448 

10.90389 

2.69 

0.0313 


SPSS 


Coeficientes 9 


M odelo 

Coeficientes sin 
estandarizar 

Coeficientes 

estandarizados 

t 

Sig. 

B 

Error estándar 

Beta 

1 (Constante) 

32.948 

39.242 


.840 

.429 

Recámaras 

28.647 

9.215 

.587 

3.109 

.017 

Baños 

29.284 

10.904 

.507 

2.686 

.031 


“Variable dependiente: Precio 
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STATISTIX 

Statistix 8.0 

Unweighted Least Squares Linear Regression of Price 
Predictor 


Variables 

Coefñcients 

Std Error 

T 

P 

VIF 

Constant 

32.9483 

39.2425 

0.84 

0.4289 


Bedrooms 

28.6466 

9.21547 

3.11 

0.0171 

1.1 

Baths 

29.2845 

10.9039 

2.69 

0.0313 

1.1 

R-Squared 

0.7700 






Estimated Price = 32.9 + 28.6(5) + 29.3(4) = 293.1 thousand. 


15.31 3.12. 

15.32 a) 5.883; b) 0.6882. 

15.33 0.9927. 

15.34 a) 0.7567; b) 0.7255; c) 0.6710. 

15.37 Se usa la secuencia "Statistics => Linear models => Partiai Correlations". Se llena la siguiente ventana de diálogo 
como se muestra. 



Se obtienen los resultados siguientes. 

Statistix 8.0 

Partiai Correlations with XI 
Controlled for X3 


X2 


0.5950 

























536 Respuestas a los problemas suplementarios 


De igual manera, se encuentra que: 

Statistix 8.0 

Partial Correlations with XI 
Controlled for X2 

X3 -0.8995 

y 

Statistix 8.0 

Partial Correlations with X2 
Controlled for XI 

X3 0.8727 

15.38 a) 0.2672; b) 0.5099; c) 0.4026. 

15.42 a)X 4 = 6X 1 + 3X 2 -4X 3 -100;lb)54. 

15.43 a) 0.8710; b) 0.8587; c) -0.8426. 

15.44 a) 0.8947; b ) 2.680. 

15.45 Con cualquiera de las soluciones siguientes se obtendrán los mismos coeficientes que resolviendo las ecuaciones norma¬ 
les. En EX CEL se usa la secuencia "Tools => Data analysis => Regression" para hallar la ecuación de regresión, así 
como otras medidas de regresión. La parte de los resultados a partir de la cual se obtiene la ecuación de regresión es la 
siguiente: 


Coeficientes 


Intersección 

-25.3355 

Fumador 

-302.904 

Alcohol 

-4.57069 

Ejercicio 

-60.8839 

Alimentación 

-36.8586 

Peso 

16.76998 

Edad 

-9.52833 


En M INITAB se emplea la secuencia “Stat => Regression => Regression" para hallar la ecuación de regresión. La 
parte de los resultados a partir de la cual se encuentra la ecuación de regresión es la siguiente. 


Análisis de regresión: M edcost versus fumador, alcohol,... 

The regression equation is 

Medcost = — 25 — 303 smoker — 4.6 alcohol — 60.9 Exercise — 37 Dietary +16.8 weight 
—9.53 Age 


Predictor 

Coef 

SE Coef 

T 

P 

Constant 

-25.3 

644.8 

-0.04 

0.970 

smoker 

-302.9 

256.1 

-1.18 

0.271 

alcohol 

-4.57 

11.89 

-0.38 

0.711 

Exercise 

-60.88 

19.75 

-3.08 

0.015 
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Dietary 

-36.9 

104.0 

-0.35 

0.732 

weight 

16.770 

3.561 

4.71 

0.002 

Age 

-9.528 

9.571 

-1.00 

0.349 


En SAS se emplea la secuencia “Statistics => Regression => Linear" para hallar la ecuación de regresión. La parte 
de los resultados a partir de la cual se encuentra la ecuación de regresión es la siguiente. 

The REG Procedure 
Model: MODEL1 

Dependent Variable: Medcost Medcost 

Number of Observations Read 16 

Number of Observations Used 15 

Number of Observations with Missing Valúes 1 

Root MSE 224.41971 R-Square 0.9029 

Dependent Mean 2461.80000 Adj R-Sq 0.8301 

Coeff Var 9.11608 


Parameter Estimates 


Variable 

Label 

DF 

Parameter 

Estimate 

Standard 

Error 

t valué 

Pr > | t 

Intercept 

Intercept 

1 

-25.33552 

644.84408 

-0.04 

0.9696 

smoker 

smoker 

1 

-302.90395 

256.11003 

-1.18 

0.2709 

alcohol 

alcohol 

1 

-4.57069 

11.88579 

-0.38 

0.7106 

Exercise 

Exercise 

1 

-60.88386 

19.75371 

-3.08 

0.0151 

Dietary 

Dietary 

1 

-36.85858 

104.04736 

-0.35 

0.7323 

weight 

weight 

1 

16.76998 

3.56074 

4.71 

0.0015 

Age 

Age 

1 

-9.52833 

9.57104 

-1.00 

0.3486 


En SPSS se emplea la secuencia "Analysis=> Regression => Linear" para hallar la ecuación de regresión. La parte 
de los resultados a partir de la cual se encuentra la ecuación de regresión es la siguiente. Ver bajo la columna de coeficien¬ 
tes no estandarizados. 


C oeficientes 9 


Modelo 

Coeficientes no 

estandarizados 

Coeficientes 

estandarizados 

t 

Sig. 

B 

Error estándar 

Beta 

1 (Constante) 

-25.336 

644.844 


-.039 

.970 

fumador 

-302.904 

256.110 

-.287 

-1.183 

.271 

alcohol 

-4.571 

11.886 

-.080 

-.385 

.711 

ejercicio 

-60.884 

19.754 

-.553 

-3.082 

.015 

dieta 

-36.859 

104.047 

-.044 

-.354 

.732 

peso 

-16.770 

3.561 

.927 

4.710 

.002 

edad 

-9.528 

9.571 

-.124 

-.996 

.049 


Variable dependiente: medcost 


En STATISTIX se emplea la secuencia "Statistics => Linear models=> Linear regression" para hallar la ecuación 
de regresión. La parte de los resultados a partir de la cual se encuentra la ecuación de regresión es la siguiente. Ver bajo la 
columna de coeficientes. 
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Statistix 8.0 

Unweighted Least Squares Linear Regression of Medcost 


Predictor 


Variables 

Coefficient 

Std Error 

T 

P 

VIF 

Constant 

-25.3355 

644.844 

-0.04 

0.9696 


Age 

-9.52833 

9.57104 

-1.00 

0.3486 

1.3 

Dietary 

-36.8586 

104.047 

-0.35 

0.7323 

1.3 

Exercise 

-60.8839 

19.7537 

-3.08 

0.0151 

2.6 

alcohol 

-4.57069 

11.8858 

-0.38 

0.7106 

3 . 6 

smoker 

-302.904 

256.110 

-1.18 

0.2709 

4.9 

weight 

16.7700 

3.56074 

4.71 

0.0015 

3.2 


CAPÍTULO 16 

16.21 A los niveles de significancia 0.05 y 0.01 no hay diferencia significativa entre las cinco variedades. El análisis proporcio¬ 
nado por M INITAB es el siguiente: 

One-way AMOVA: A, B, C, D, E 


Source 

DF 

SS 

MS F 

P 

Factor 

4 

27.2 

6.8 0.65 

0.638 

Error 

15 

157.8 

10.5 


Total 

19 

185.0 



S = 3.243 

R- 

■Sq = 14. 

71% R-Sq(adj) 

=0.00% 





Individual 95% CIs For Mean Based on 





Pooled StDev 

Level 

N 

Mean 

StDev - 

+ 

1 

1 

1 

1 

1 

1 

1 

1 

+ 

1 

1 

1 

1 

1 

1 

1 

1 

+ 

1 

1 

1 

1 

1 

1 

1 

+ 

1 

A 

4 

16.500 

3.697 

(-*-j 

B 

4 

14.500 

2.082 (-- 

-*-) 

C 

4 

17.750 

3.862 

(-*-) 

D 

4 

16.000 

3.367 

(-*-j 

E 

4 

17.500 

2.887 

( -*-) 


12.0 15.0 18.0 21.0 

16.22 A los niveles de significancia 0.05 y 0.01 no hay diferencia entre los cuatro tipos de neumáticos. El análisis proporcionado 
por STATISTIX es el siguiente: 

Statistix 8.0 

Completely Randomized AOV for Mileage 


Source 

DF 

SS 

MS 

F 

P 

Type 

3 

77.500 

25.8333 

2.39 

0.0992 

Error 

20 

216.333 

10.8167 



Total 

23 

293.833 




Grand Mean 

34.083 

CV 9.65 




Chi-Sq DF P 

Bartlett' s Test of Equal Variances 4.13 

Cochran's Q 0.5177 

Largest Var / Smallest Var 6.4000 


3 


0.2476 
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Component of variance for between groups 2.50278 

Effective cell size 6.0 

Type Mean 

A 35.500 

B 36.000 

C 33.333 

D 31.500 

16.23 Al nivel de significancia 0.05 sí hay diferencia entre los tres métodos de enseñanza, pero no al nivel 0.01. El análisis pro¬ 
porcionado por EXCEL es el siguiente: 


Métodol 

Métodoll 


Métodolll 


75 

81 


73 


62 

85 


79 


71 

68 


60 


58 

92 


75 


73 

90 


81 


Análisis de varianza de un factor 



RESUMEN 





Grupos 

Cuenta 

Suma 

Promedio 

Varianza 

Métodol 

5 

339 

67.8 

54.7 

Métodoll 

5 

416 

83.2 

90.7 

Métodolll 

5 

368 

73.6 

67.8 


Análisis de varianza 


Origen de las 
variaciones 

SS 

df 

MS 

F 

Valor p 

Entre grupos 

604.9333 

2 

302.4667 

4.265098 

0.040088 

Dentro de los grupos 

852.8 

12 

71.06667 



Total 

1 457.733 

14 





16.24 Al nivel de significancia 0.05 sí hay diferencia entre las cinco marcas, pero no al nivel 0.01. El análisis proporcionado por 
SPSS es el siguiente: 


ANÁLISIS DE VARIANZA 


mpg 



Suma de 
cuadrados 

df 

Cuadrado medio 

F 

Sig. 

Entre grupos 

52.621 

4 

13.155 

4.718 

.010 

En los grupos 

44.617 

16 

2.789 



Total 

97.238 

20 





16.25 A los dos niveles hay diferencia entre las cuatro materias. El análisis proporcionado por SAS es el siguiente: 

The ANOVA Procedure 

Class Level Information 
Class Levels Valúes 

Subject 4 1234 

Number of Observations Read 
Number of Observations Used 


16 

16 
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The ANOVA Procedure 

Dependent Variable: Grade 




Sum of 




Source 

DF 

Squares 

Mean Square 

F Valué 

Pr > F 

Model 

3 

365.5708333 

121.8569444 

7.35 

0.0047 

Error 

12 

198.8666667 

16.5722222 



Corrected Total 

15 

564.4375000 





16.26 Al nivel de significancia 0.05 no hay diferencia ni entre los operadores ni entre las máquinas. A continuación se presenta 
el análisis proporcionado por M INITAB. 


Two-way 

ANOVA: 

Number versus Machine 

, Operator 

Source 

DF 

SS 

MS 

F 

P 

Machine 

2 

56 

28.0 

4.31 

0.101 

Operator 

2 

6 

3.0 

0.46 

0.660 

Error 

4 

26 

6.5 



Total 

8 

88 




S = 2.550 

R-Sq 

= 70. 

.45% R- 

■Sq(adj) = 

40.91% 


16.27 Al nivel de significancia 0.01 no hay diferencia ni entre los operadores ni entre las máquinas. A continuación se presenta 
el análisis proporcionado por EXCEL. Comparar el análisis de EXCEL con el proporcionado por M INITAB en el problema 
anterior. 

Operadorl Operador2 Operador3 
Máquinal 23 27 24 

Máquina2 34 30 28 

Máquina3 28 25 27 


Análisis de varianza de dos factores con una sola muestra por grupo 


RESUMEN 

Cuenta 

Suma 

Promedio 

Varianza 

Fila 1 

3 

74 

24.66667 

4.333333 

Fila 2 

3 

92 

30.66667 

9.333333 

Fila 3 

3 

80 

26.66667 

2.333333 

Columna 1 

3 

85 

28.33333 

30.33333 

Columna 2 

3 

82 

27.33333 

6.333333 

Columna 3 

3 

79 

26.33333 

4.333333 

Análisis de varianza 

Origen de las 
variaciones 

SS 

df 

MS F 

Valor p 

Filas 

56 

2 

28 4.307692 

0.100535 

Columnas 

6 

2 

3 0.461538 

0.660156 

Error 

26 

4 

6.5 


Total 

88 

8 




16.28 Al valor p en SPSS se le llama si g. El valor p para los bloques es 0.640 y el valor p para los tipos de maíz es 0.011, que 
es menor a 0.05 y por lo tanto es significativo. AI nivel de significancia 0.05 no hay diferencia entre los bloques. AI nivel 
de significancia 0.05 sí hay diferencias en los rendimientos debido al tipo de maíz. A continuación se presenta el análisis 
proporcionado por SPSS. 
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Pruebas de efectos entre temas 


Variable dependiente: resultado 


Origen 

Tipo III Suma 

de cuadrados 

df 

Cuadrado medio 

F 

Sig. 

Modelo corregido 

77.600 a 

7 

11.086 

2.867 

.053 

Intersección 

3 920.000 

1 

3 920.000 

1 013.793 

.000 

bloque 

10.000 

4 

2.500 

.647 

.640 

tipo 

67.600 

3 

22.533 

5.828 

.011 

Error 

46.400 

12 

3.867 



Total 

4 044.000 

20 




Total corregido 

124.000 

19 





a R cuadrada = .626 (R cuadrada ajustada = .408) 


16.29 Al nivel de significancia 0.01, en los rendimientos no hay diferencias que se deban a los bloques o al tipo de maíz. Comparar 
estos resultados de STATISTIX con los resultados de SPSS del problema 16.28. 

Statistix 8.0 

Randomized Complete Block AOV Table for yield 


Source 

DF 

SS 

MS 

F 

P 

block 

4 

10.000 

2.5000 

5.83 

0.0108 

type 

3 

67.600 

22.5333 



Error 

12 

46.400 

3.8667 



Total 

19 

124.000 





Grand Mean 14.000 CV 14.05 

Means of yield for type 
type Mean 

1 13.600 

2 17.000 

3 12.000 

4 13.400 


16.30 SAS representa el valor p como P r > F. En los dos últimos renglones de los resultados, se ve que tanto los automóviles 
como las marcas de los neumáticos son significativos al nivel 0.05. 

The GLM Procedure 
Class Level Information 
Class Levels Valúes 

Auto 6 123456 

Brand 4 1234 

The GLM Procedure 
Dependent Variable: lifetime 

Sum of 


Source 

DF 

Squares 

Mean Square 

F Valué 

Pr > F 

Model 

8 

201.3333333 

25.1666667 

4.08 

0.0092 

Error 

15 

92.5000000 

6.1666667 



Corrected Total 

23 

293.8333333 
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Source 


DF 


Type III SS 


Mean Square 


F Valué 


Pr > F 


Auto 

Brand 


5 123.8333333 24.7666667 4.02 
3 77.5000000 25.8333333 4.19 


0.0164 

0.0243 


16.31 Compare el análisis de M INITAB en este problema con el de SAS en el problema 16.30. Al nivel de significancia 0.01, no 
hay diferencia entre los automóviles ni entre las marcas, ya que los valores p son 0.016 y 0.024, ambos mayores a 0.01. 


Two-way 

ANOVA: lifetime versus Auto, Brand 

Source 

DF 

SS 

MS F 

P 

Auto 

5 

123.833 

24.7667 4.02 

0.016 

Brand 

3 

77.500 

25.8333 4.19 

0.024 

Error 

15 

92.500 

6.1667 


Total 

23 

293.833 



S = 2.483 

R- 

-Sq = 68.52% 

R-Sq(adj) = 51. 

.73% 


16.32 A continuación se presentan los resultados de STATISTIX. El valor p que es 0.3171 indica que, al nivel de significancia 
0.05 no hay diferencia entre las escuelas. 

Statistix 8.0 

Randomized Complete Block AOV Table for Grade 


Source 

DF 

SS 

MS 

F 

P 

Method 

2 

604.93 

302.467 



School 

4 

351.07 

87.767 

1.40 

0.3171 

Error 

8 

501.73 

62.717 



Total 

14 

1457.73 





Para los métodos de enseñanza, el valor de F es 4.82 y el valor p es 0.0423. Por lo tanto, al nivel de significancia 0.05, sí 
hay diferencia entre los métodos de enseñanza. 


16.33 Los resultados de EXCEL indican que al nivel de significancia 0.05, ni el color del pelo ni las estaturas de las mujeres 
adultas tienen Influencia en los logros escolares. El valor p para el color del pelo es 0.4534 y el valor p para la estatura es 
0.2602. 



Pelirroja 

Rubia 

Castaña 

Alta 

75 

78 

80 

Mediana 

81 

76 

79 

Baja 

73 

75 

77 


Análisis de varianza de dos factores con una sola muestra por grupo 


RESUMEN 

Cuenta 

Suma 

Promedio 

Varianza 

Fila 1 

3 

233 

77.66667 

6.333333 

Fila 2 

3 

236 

78.66667 

6.333333 

Fila 3 

3 

225 

75 

4 

Columna 1 

3 

229 

76.33333 

17.33333 

Columna 2 

3 

229 

76.33333 

2.333333 

Columna 3 

3 

236 

78.33333 

2.333333 
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Análisis de varianza 


Origen de las 
variaciones 

SS 

df 

MS 

F 

Valor p 

Filas 

21.55556 

2 

10.77778 

1.920792 

0.260203 

Columnas 

10.88889 

2 

5.444444 

0.970297 

0.453378 

Error 

22.44444 

4 

5.611111 



Total 

54.88889 

8 





16.34 En los siguientes resultados de SPSS, al valor p se le llama S i g. El valor p para color de pelo es 0.453 y el valor p para 
estatura es 0.260. Éstos son los mismos valoresp que se obtuvieron con EXCEL en el problema 16.33. Dado que ninguno 
de ellos es menor que 0.01, al nivel de significancia 0.01 no son significativos. Es decir, las puntuaciones no son diferentes 
de acuerdo con los distintos colores de pelo ni tampoco de acuerdo con las diferentes estaturas. 


Tests of Between-Subj ects Effects 


Variable dependiente: puntuación 


Origen 

Tipo III Suma 

de cuadrados 

df 

Cuadrado medio 

F 

Sig. 

Modelo corregido 

32.444 a 

4 

8.111 

1.446 

.365 

Intersección 

53515.111 

1 

53 515.111 

9 537.347 

.000 

Pelo 

10.889 

2 

5.444 

.970 

.453 

Estatura 

21.556 

2 

10.778 

1.921 

.260 

Error 

22.444 

4 

5.611 



Total 

53 570.000 

9 




Total corregido 

54.889 

8 





a R cuadrada = .591 (R cuadrada ajustada = .182) 


16.35 En los resultados de M INITAB se observa que al nivel de significancia 0.05 hay diferencias debidas a la ubicación, pero 
no hay diferencias debidas a los fertilizantes. La interacción es significativa al nivel 0.05. 

ANOVA: yield versus location, fertilizer 

Factor Type Levels Valúes 

location fixed 2 1, 2 

fertilizer fixed 4 1, 2, 3, 4 


Analysis of Variance for yield 


Source 

DF 

SS 

MS 

F 

P 

location 

1 

81.225 

81.225 

12.26 

0.001 

fertilizer 

3 

18.875 

6.292 

0.95 

0.428 

location*fertilizer 

3 

78.275 

26.092 

3.94 

0.017 

Error 

32 

212.000 

6.625 



Total 

39 

390.375 





16.36 En los resultados de STATISTIX se observa que al nivel de significancia 0.01 hay diferencias debidas a la ubicación, pero 
no hay diferencias debidas a los fertilizantes. Al nivel 0.01 no hay una interacción significativa. 
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Statistix 8.0 

Analysis of Variance Table for yield 


Source 

DF 

SS 

MS 

F 

P 

fertilize 

3 

18.875 

6.2917 

0.95 

0.4283 

location 

1 

81.225 

81.2250 

12.26 

0.0014 

fertilize*location 

3 

78.275 

26.0917 

3.94 

0.0169 

Error 

32 

212.000 

6.6250 



Total 

39 

390.375 





16.37 En los siguientes resultados de SAS, el valor p para las máquinas es 0.0664, el valor p para los operadores es 0.0004 y el 
valorp para la interacción es 0.8024. Al nivel de significancia 0.05, sólo los operadores son significativos. 


The GLM Procedure 
Class Level Information 
Class Levels Valúes 

Operator 4 1234 

Machine 2 12 


Number of Observations Read 40 

Number of Observations Used 40 

The GLM Procedure 
Dependent Variable: Articles 

Sum of 


Source 

DF 

Squares 

Mean Square 

F Valué 

Pr > F 

Model 

7 

154.8000000 

22.1142857 

4.08 

0.0027 

Error 

32 

173.6000000 

5.4250000 



Corrected Tot 

39 

328.4000000 




Source 

DF 

Type III SS 

Mean Square 

F Valué 

Pr >F 

Machine 

1 

19.6000000 

19.6000000 

3.61 

0.0664 

Operator 

3 

129.8000000 

43.2666667 

7.98 

0.0004 

Operator*Machine 

3 

5.4000000 

1.8000000 

0.33 

0.8024 


Los siguientes resultados de M IIMITAE¡ son ¡guales a los de SAS. 


ANOVA: Articles versus Machine, Operator 


Factor 

Machine 

Operator 


Type Levels 
ñxed 2 
ñxed 4 


Valúes 
1 , 2 

1, 2, 3, 4 


Analysis of Variance for Articles 


Source 

DF 

SS 

MS 

F 

P 

Machine 

1 

19.600 

19.600 

3.61 

0.066 

Operator 

3 

129.800 

43.267 

7.98 

0.000 

Machine*Operator 

3 

5.400 

1.800 

0.33 

0.802 

Error 

32 

173.600 

5.425 



Total 

39 

328.400 





16.38 En los siguientes resultados de STATISTIX, los valores p para vari aciones del suelo en dos direcciones perpendiculares son 
0.5658 y 0.3633 y el valor p para los tratamientos es 0.6802. AI nivel de significancia 0.01, ninguno de los tres es signifi¬ 
cativo. 
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Statistix 8.0 

Latin Square AOV Table for Yield 


Source 

DF 

SS 

MS 

F 

P 

Row 

3 

17.500 

5.8333 

0.74 

0.5658 

Column 

3 

30.500 

10.1667 

1.28 

0.3633 

Treatment 

3 

12.500 

4.1667 

0.53 

0.6802 

Error 

6 

47.500 

7.9167 



Total 

15 

108.000 





16.39 Los siguientes resultados de M INITAB son iguales a los resultados de STATISTIX del problema 16.38. Ninguno de los 
factores es significativo al nivel 0.05. 


General Linear Model: Yield versus Row, Column, Treatment 


Factor 

Type 

Levels 

Valúes 




Row 

fixed 

4 

1, 2, 3, 

4 



Column 

fixed 

4 

1, 2, 3, 

4 



Treatment 

fixed 

4 

1, 2, 3, 

4 



Analysis of Variance for yield, using Adjusted SS 

for Tests 


Source 

DF 

Seq SS 

Adj SS 

Adj MS 

F 

P 

Row 

3 

17.500 

17.500 

5.833 

0.74 

0.567 

Column 

3 

30.500 

30.500 

10.167 

1.28 

0.362 

Treatment 

3 

12.500 

12.500 

4.167 

0.53 

0.680 

Error 

6 

47.500 

47.500 

7.917 



Total 

15 

108.000 






16.40 En los resultados obtenidos con SPSS no se observa que al nivel de significancia 0.05 haya diferencia en los logros esco¬ 
lares debido al color de pelo, a la estatura o al lugar de nacimiento. 


Pruebas de efectos entre temas 


Variable dependiente: puntuación 


Origen 

Tipo III Suma 

de cuadrados 

df 

Cuadrado medio 

F 

Sig. 

Modelo corregido 

44.000 a 

6 

7.333 

1.347 

.485 

Intersección 

53 515.111 

1 

53 515.11 

9 829.306 

.000 

Pelo 

10.889 

2 

5.444 

1.000 

.500 

Estatura 

21.556 

2 

10.778 

1.980 

.336 

Por nacimiento 

11.556 

2 

5.778 

1.061 

.485 

Error 

10.889 

2 

5.444 



Total 

53 570.000 

9 




Total corregido 

54.889 

8 





a R cuadrada = .802 (R cuadrada ajustada = .206) 


16.41 En el análisis de M INITAB se observa que hay diferencias significativas debidas a las especies de los pollitos y a las can¬ 
tidades de la primera sustancia química, pero no debidas a las cantidades de la segunda sustancia química o al peso inicial 
de los pollitos. Obsérvese que para las especies el valor p es 0.009 y para la primera sustancia química el valor p es 0.032. 
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General Linear Model: Wtgain versus Weight, Species, ... 


Factor 

Type 

Levels 

Valúes 




Weight 

ñxed 

4 

1, 2, 

3, 

4 



Species 

ñxed 

4 

1, 2, 

3, 

4 



Chemicall 

ñxed 

4 

1, 2, 

3, 

4 



Chemical2 

ñxed 

4 

1, 2, 

3, 

4 



Analysis of Variance for Wtgain, using Adjusted SS 

for Tests 


Source 

DF 

Seg SS 

Adj SS 


Adj MS 

F 

P 

Weight 

3 

2.7500 

2.7500 


0.9167 

2.20 

0.267 

Species 

3 

38.2500 

38.2500 

12.7500 

30.60 

0.009 

Chemicall 

3 

16.2500 

16.2500 


5.4167 

13.00 

0.032 

Chemical2 

3 

7.2500 

7.2500 


2.4167 

5.80 

0.091 

Error 

3 

1.2500 

1.2500 


0.4167 



Total 

15 

65.7500 







16.42 En SPSS al valor p se le llama Si g. Hay diferencias significativas en la resistencia del cable debidas al tipo de cable, pero 
no hay diferencias significativas debidas a los operadores, las máquinas o las empresas. 

Pruebas de efectos entre temas 


Variable dependiente: resistencia 


Origen 

Tipo III Suma 

de cuadrados 

df 

Cuadrado medio 

F 

Sig. 

Modelo corregido 

6 579.750 a 

12 

548.313 

5.489 

.094 

Intersección 

488 251.563 

1 

488 251.563 

4 887.607 

.000 

Tipo 

4 326.188 

3 

1 442.063 

14.436 

.027 

Empresa 

2 066.188 

3 

688.729 

6.894 

.074 

Operador 

120.688 

3 

40.229 

.403 

.763 

Máquina 

66.888 

3 

22.229 

.223 

.876 

Error 

299.688 

3 

99.896 



Total 

495 131.000 

16 




Total corregido 

6 879.438 

15 





a R cuadrada = .956 (R cuadrada ajustada = .782) 


16.43 AI nivel de significancia 0.05 hay diferencias significativas entre los tres tratamientos, pero al nivel de significancia 0.01, 
no. A continuación se presenta el análisis que se obtiene con EXCEL. 


ABC 

3 4 6 

5 2 4 

4 3 5 

4 3 5 


Análisis de varianza de un factor 
RESUMEN 


Grupos 

Cuenta 

Suma 

Promedio 

Varianza 

A 

4 

16 

4 

0.666667 

B 

4 

12 

3 

0.666667 

C 

4 

20 

5 

0.666667 












Respuestas a los problemas suplementarios 547 


Análisis de varianza 


Origen de las 
variaciones 

SS 

df 

MS 

F 

Valor p 

Entre grupos 

8 

2 

4 

6 

0.022085 

Dentro de los grupos 

6 

9 

0.666667 



Total 

14 

11 





16.44 El valor p que da M INITAB es 0.700. Entre los CI no hay diferencia debido a las estaturas. 

One-way ANOVA: Tall, Short, Médium 


Source 

DF 

SS 

MS F P 

Factor 

2 

55.8 

27.9 0.37 0.700 

Error 

12 

911.5 

76.0 

Total 

14 

967.3 


S = 8.715 

R- 

■Sq = 5.77% 

R-Sq(adj) = 0.00% 




Individual 95% CIs For Mean Based on 




Pooled StDev 

Level 

N 

Mean 

StDev -+-+-+-+ 

Tall 

5 

107.00 

1.0.58 (-*-) 

Short 

4 

105.00 

8.33 (-*-) 

Médium 

6 

102.50 

7.15 (-*-) 




96.0 102.0 108.0 114.0 


16.46 En los resultados de SPSS, al valorp se le llama Si g. AI nivel de significancia 0.05, existe una diferencia significativa en 
las puntuaciones de examen, debida tanto a ser o no veterano como al CI. 

Pruebas de efectos entre temas 


Variable dependiente: puntuación 


Origen 

Tipo III Suma 

de cuadrados 

df 

Cuadrado medio 

F 

Sig. 

Modelo corregido 

264.333 a 

3 

88.111 

176.222 

.006 

Intersección 

38 080.667 

1 

38 080.667 

76 161.333 

.000 

Veterano 

24.000 

1 

24.000 

48.000 

.020 

Cl 

240.333 

2 

120.167 

240.333 

.004 

Error 

1.000 

2 

.500 



Total 

38 346.000 

6 




Total corregido 

265.333 

5 





a R cuadrada = .996 (R cuadrada ajustada = .991) 


16.47 En el análisis de STATISTIX se encuentra que al nivel de significancia 0.01 las diferencias en las puntuaciones de examen 
debidas a ser o no veterano no son significativas, pero las diferencias debidas al CI sí son significativas. 

Statistix 8.0 

Randomized Complete Block AOV Table for Score 

Source DF SS MS F P 

Veteran 1 24.000 24.000 48.00 0.020 

IQ 2 240.333 120.167 240.33 0.0041 
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Error 2 1.000 0.500 

Total 5 265.333 


16.48 En el análisis de M INITAB se observa que al nivel de significancia 0.05 las diferencias en las puntuaciones de examen 
debidas a la ubicación no son significativas, pero las diferencias debidas al Cl, sí. 


Testscore versus Location, IQ 

SS MS F P 


Two-way ANOVA 


Source DF 
Location 3 
IQ 2 
Error 6 
Total 11 


6.250 2.083 
221.167 110.583 
101.500 16.917 
328.917 


0.12 0.943 

6.54 0.031 


16.49 En el análisis de SAS se observa que al nivel de significancia 0.01 las diferencias en las puntuaciones de examen debidas 
a la ubicación no son significativas, pero las diferencias debidas al Cl, sí. Recuerde que el valorp se escribe P r > F. 


The GLM Procedure 
Class Level Information 
Class Levels Valúes 

Location 4 123 

IQ 3 123 


4 


Number of Observations Read 
Number of Observations Used 


12 

12 


Source 

Location 

IQ 


DF 

3 

2 


The GLM Procedure 


Type III SS 
6.2500000 
221.1666667 


Mean Square 
2.0833333 
110.5833333 


F Valué 
0.12 
6.54 


Pr > F 

0.9430 

0.0311 


16.53 En el análisis de M INITAB se observa que debido a la ubicación, las cantidades de óxido no son significativas al nivel de 
significancia 0.05. No hay interacción significativa entre ubicación y sustancias químicas. 


ANOVA: rust versus location, Chemical 


Factor 

location 

Chemical 


Type Levels 
ñxed 2 
ñxed 3 


Valúes 


1 , 2 

1 , 2 , 


Analysis of Variance for rust 


Source DF 
location 1 
Chemical 2 
location*chemical 2 
Error 18 
Total 23 


SS 

0.667 

20.333 
0.333 

18.000 

39.333 


MS 
0.667 
10.167 
0.167 
1.000 


F 

0.67 
10.17 
0.17 


P 

0.425 
0.001 
0.848 


3 


Respuestas a los problemas suplementarios 549 


16.54 En el análisis de STATISTIX se observa que al nivel de significancia 0.05, las diferencias en el rendimiento debidas a la 
ubicación son significativas, pero las diferencias debidas a las variedades no son significativas. No hay interacción signi¬ 
ficativa entre la ubicación y las variedades. 

Statistix 8 . O 

Analysis of Variance Table for Yield 


Source 

DF 

SS 

MS 

F 

P 

Variety 

4 

35.333 

8.8333 

1.07 

0.3822 

location 

2 

191.433 

95.7167 

11.60 

0.0001 

Variety*location 

8 

82.567 

10.3208 

1.25 

0.2928 

Error 

45 

371.250 

8.2500 



Total 

59 

680.583 





16.55 En el análisis de M INITAB se observa que al nivel de significancia 0.01, las diferencias en el rendimiento debidas a la 
ubicación son significativas, pero las diferencias debidas a las variedades no son significativas. No hay interacción signi¬ 
ficativa entre la ubicación y las variedades. 


General Linear Model: Yield versus location, Variety 


Factor 

location 

variety 


Type Levels 
fixed 3 
fixed 5 


Valúes 
1, 2, 3 
1, 2, 3, 4, 5 


Analysis of Variance for Yield, using Adjusted SS for Tests 


Source 

location 

Variety 

location*Variety 

Error 

Total 


DF Seq SS 

2 191.433 

4 35.333 

8 82.567 

45 371.250 

59 680.583 


Adj SS Adj MS 
191.433 95.717 

35.333 8.833 

82.567 10.321 

371.250 8.250 


F P 

11.60 0.000 

1.07 0.382 

1.25 0.293 


16.56 Observando laANOVA de SPSS y teniendo en cuenta queS i g. en SPSS es lo mismo que valor p, se ve que, al nivel 0.05, 
el factor 1, el factor 2 yeltratami ento (treatment) no tienen un efecto significativo sobre la variable de res¬ 
puesta, ya que el valor p de los tres es mayor que 0.05. 

Pruebas de efectos entre temas 


Variable dependiente: respuesta 


Origen 

Tipo III Suma 

de cuadrados 

df 

Cuadrado medio 

F 

Sig. 

Modelo corregido 

92.667 a 

6 

15.444 

7.316 

.125 

Intersección 

2 567.111 

1 

2 567.111 

1 216.000 

.001 

Factorl 

74.889 

2 

37.444 

17.737 

.053 

Factor2 

17.556 

2 

8.778 

4.158 

.194 

Tratamiento 

.222 

2 

.111 

.053 

.950 

Error 

4.222 

2 

2.111 



Total 

2 664.000 

9 




Total corregido 

96.889 

8 





a R cuadrada = .956 (R cuadrada ajustada = .826) 
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16.58 Observando la A NOVA de SPSS y teniendo en cuenta que Si g. en SPSS es lo mismo que valor p, se ve que al nivel 0.05 
el Factor 1, el Factor 2, el trata mí ento I ati no (latín treatment) y el trata mi ento grí ego (greek treatment) 
no tienen un efecto significativo sobre la variable de respuesta, ya que el valor p de los cuatro es mayor que 0.05. 


Pruebas de efectos entre temas 


Variable dependiente: respuesta 


Origen 

Tipo III Suma 

de cuadrados 

df 

Cuadrado medio 

F 

Sig. 

Modelo corregido 

362.750 a 

12 

30.229 

.924 

.607 

Intersección 

1 914.063 

1 

1 914.063 

58.482 

.005 

Factorl 

5.188 

3 

1.729 

.053 

.981 

Factor2 

15.188 

3 

5.063 

.155 

.920 

Latino 

108.188 

3 

36.063 

1.102 

.469 

Griego 

234.188 

3 

78.063 

2.385 

.247 

Error 

98.188 

3 

32.729 



Total 

2 375.000 

16 




Total corregido 

460.938 

15 





a R cuadrada = .787 (R cuadrada ajustada = .065) 


CAPÍTULO 17 

17.26 Con la alternativa de dos colas, el valor p es 0.0352. Al nivel de significancia 0.05 hay diferencia debida al aditivo, pero al 
nivel 0.01, no. El valor p se obtiene usando la distribución binomial y no la aproximación normal a la binomial. 

17.27 Con la alternativa de una cola, el valor p es 0.0176. Como el valor p es menor que 0.05, se rechaza la hipótesis nula deque 
no hay diferencia debida al aditivo. 

17.28 Empleando EXCEL, el valor p se obtiene con =1 - Bl NOMDI ST( 24, 31, 0. 5, 1) queda 0.00044. El programa es efec¬ 
tivo al nivel de significancia 0.05. 

17.29 Empleando EXCEL, el valor p se obtiene con =1 - Bl NOMDI ST( 15, 22, 0. 5, 1) , que da 0.0262. El programa es efec¬ 
tivo al nivel de significancia 0.05. 

17.30 Empleando EXCEL, el valorp se obtiene con =1 - Bl NOMDI ST( 16, 25, 0. 5, 1) .queda 0.0539. Al nivel de significan¬ 
cia 0.05 no se puede concluir que la marca B se prefiera a la marca A. 

17.31 BS = 25 BS = 30 BS = 35 BS = 40 


41 

16 

11 

6 

1 

37 

12 

7 

2 

-3 

25 

0 

-5 

-10 

-15 

43 

18 

13 

8 

3 

42 

17 

12 

7 

2 

28 

3 

-2 

-7 

-12 

32 

7 

2 

-3 

-8 

36 

11 

6 

1 

-4 

27 

2 

-3 

-8 

-13 

33 

8 

3 

-2 

-7 
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35 

10 

5 

0 

-5 

24 

-1 

-6 

-11 

-16 

22 

-3 

-8 

-13 

-18 

34 

9 

4 

-1 

-6 

28 

3 

-2 

-7 

-12 

38 

13 

8 

3 

-2 

46 

21 

16 

11 

6 

41 

16 

11 

6 

1 

27 

2 

-3 

-8 

-13 

31 

6 

1 

-4 

-9 

23 

-2 

-7 

-12 

-17 

30 

5 

O 

-5 

-10 

37 

12 

7 

2 

-3 

36 

11 

6 

1 

-4 

24 

-1 

-6 

-11 

-16 

O 

.00154388 

2 *BINOMDIST 

(4,24,0.5,1) 

Reject nuil 

O. 

307456255 

2 *BINOMDIST 

(9,24,0.5,1) 

Do not reject nuil 

O. 

541256189 

2 *BINOMDIST 

(10,24,0.5,1) 

Do not reject nuil 

O. 

004077315 

2 *BINOMDIST 

(5,25,0.5,1) 

Reject nuil 


17.34 La suma de los rangos de la muestra menor = 141.5 y la suma de los rangos de la muestra mayor = 158.5. El valor p para 
dos colas = 0.3488. Al nivel de significancia 0.05 no se rechaza la hipótesis nula de no diferencia, pues el valor p > 
0.05. 

17.35 En el problema 17.34, al nivel 0.01 no se puede rechazar la hipótesis nula en la prueba de una cola. 

17.36 La suma de los rangos de la muestra menor = 132.5 y la suma de los rangos de la muestra mayor = 77.5. Para dos colas el 
valor p = 0.0044. La hipótesis nula de no diferencia se rechaza tanto a nivel 0.01 como a nivel 0.05, ya que el valor p < 
0.05. 

17.37 Al nivel de significancia 0.05, el agricultor del problema 17.36 puede concluir que el trigo II da mayor rendimiento que el 
trigo I. 

17.38 Para la marca A, la suma de los rangos = 86.0 y para la marca 6, la suma de los rangos = 124.0. Para dos colas el valor p 
= 0.1620. a) AI nivel de significancia 0.05, no se rechaza la hipótesis nula de no diferencia entre las dos marcas versus hay 
diferencia, ya que el valor p > 0.05. ó) Al nivel de significancia 0.05 no se puede concluir que la marca 6 sea mejor que la 
marca A, ya que para una cola valor p (0.081) > 0.05. 

17.39 Sí, se puede emplear tanto la prueba U como la prueba de los signos para determinar si hay diferencia entre las dos máqui¬ 
nas. 

17.41 3. 

17.42 6 . 

17.46 a) 246; fo) 168; c) 0. 

17.47 a) 236; b) 115; c) 100. 

17.49 H = 2.59, DF = 4, P = 0.629. A los niveles de significancia 0.05 y 0.01, no hay diferencia entre los rendimientos de las 
cinco variedades, ya que el valor p es mayor que 0.01 y que 0.05. 

17.50 H = 8.42, DF =3 ,P= 0.038. Al nivel de significancia 0.05 sí hay diferencia entre las cuatro marcas de neumáticos, pero 
no al nivel de significancia 0.01, ya que 0.01 < valor p < 0.05. 
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17.51 H = 6.54, DF =2, P = 0.038. Al nivel de significancia 0.05 sí hay diferencia entre los tres métodos de enseñanza, pero no 
al nivel de significancia 0.01, ya que 0.01 < valor p < 0.05. 

17.52 H = 9.22, DF =3, P = 0.026. Al nivel de significancia 0.05 hay diferencia significativa entre las cuatro materias, pero no 
al nivel de significancia 0.01, ya que 0.01 < valor p < 0.05. 

17.53 a) H = 7.88, DF = 8, P = 0.446. A los niveles de significancia 0.01 y 0.05 no hay diferencia significativa entre las dura¬ 

ciones de los tres cinescopios, ya que el valor p > 0.01 y 0.05. 

b) H = 2.59, DF = 4, P = 0.629. A los niveles de significancia 0.01 y 0.05 no hay diferencia significativa entre las cinco 
variedades de trigo, ya que el valor p > 0.01 y 0.05. 

c) H = 5.70, DF = 3, P = 0.127. A los niveles de significancia 0.01 y 0.05 no hay diferencia significativa entre las cuatro 
marcas de neumáticos, ya que el valor p > 0.01 y > 0.05. 

17.54 a) H = 5.65, DF = 2, P = 0.059. A los niveles de significancia 0.01 y 0.05 no hay diferencia entre los tres métodos de 

enseñanza, ya que el valor p > 0.01 y > 0.05. 

b) H = 10.25, DF = 4, P = 0.036. Al nivel de significancia 0.05 hay diferencia entre las cinco marcas de gasolina, pero no 
al nivel 0.01, ya que 0.01 < valor p < 0.05. 

c) H = 9.22, DF = 3, P = 0.026. Al nivel de significancia 0.05 hay diferencia entre las cuatro materias, pero no al nivel 
0.01, ya que 0.01 < valor p < 0.05. 

17.55 a) 8; b) 10. 


17.56 a) El número de rachas es V = 10. 

b) La prueba de aleatorledad está basada en la distribución normal estándar. La media es 


Mv = ^ + 1= 2 ™ 14) + 1 = 13.32 


N¡ + N 2 


25 


y la desviación estándar es 


2 ( 11 )( 14 ){ 2 ( 11 )( 14 ) - 11 - 14 } 


25 2 ( 24 ) 


= 2.41 


LaZ encontrada es 


10 - 13.32 

7 — _ 

2.41 

Empleando EXCEL, el valorp es = 2* N0RMSDI ST( -1. 38) 
la aleatorledad. 

17.57 a) Aun cuando el número de corridas es menor que lo esperado, el valor p no es menor que 0.05. No se rechaza la aleato- 
rledad de la secuencia (10). 


que es 0.1676. Dado que el valor p es grande, no se duda de 


Prueba de corridas: moneda 

Runs test for coin 
Runs above and below K = O . 4 
The observed number of runs = 7 
The expected number of runs = 10.6 
8 observations above K, 12 below 

* N is small, so the following approximation may be invalid. 
P-value = 0.084 


b ) El número de rachas es mayor que lo esperado. Se rechaza la aleatoriedad de la secuencia (11). 

Prueba de corridas: moneda 

Runs test for coin 

Runs above and below K = 0.5 
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The observed number of runs = 12 
The expected number of runs = 7 
6 observations above K, 6 below 

* N is small, so the following approximation may be invalid. 
P-value = 0.002 


17.58 a) 


b ) 


0 


Sequence 
a a 

a b 

b a 


b 

a 

a 


Sampling distribution 
y f 

2 2 

3 1 

Probability distribution 
V Pr{y} 

2 0.667 

3 0.333 


Runs 

2 

3 

2 


17.59 M edia = 2.333 


Varianza = 0.222 


17.60 a) 


Sequence 
a a 

a b 

a b 

b b 

b a 

b a 


b 

a 

b 

a 

b 

a 


b 

b 

a 

a 

a 

b 


Runs 

2 

4 

3 
2 

4 
3 


Sampling distribution 
y f 

2 2 

3 2 

4 2 

Probability distribution 
V Pr{y} 

2 0.333 

3 0.333 

4 0.333 


Mean V 
Variance V 


3 

0.667 


b ) 


Sequence 
a b 

b a 


b 

b 


b 

b 


Runs 

2 

3 
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c) 


b b a 

b b b 


Sampling distribution 


y f 

2 1 

3 3 


b 

a 


Probability distribution 
V Pr { V] 

2 0.25 

3 0.75 


Mean V 2.75 

Variance V 0.188 


Sequence 

a b b 

b a b 

b b a 

b b b 

b b b 


b 

b 

b 

a 

b 


Sampling distribution 


V 

2 

3 


f 

2 

3 


Probability distribution 
V Pr { V] 

2 0.4 

3 0.6 

Mean V 2.6 

Variance V 0.24 


3 

3 


b 

b 

b 

b 

a 


Runs 

2 

3 

3 

3 

2 


17.61 a) 


Sequence 
a a 


a 

a 

a 

a 


b 

b 

b 

b 


b 

b 

b 

b 

b 

b 

b 

b 

b 

b 


a 

a 

a 

a 

b 

b 

b 

b 

b 

b 


b 

a 

b 

b 

b 

a 

b 

b 

b 

a 

a 

a 

b 

b 

b 


b 

b 

a 

b 

b 

b 

a 

b 

b 

a 

b 

b 

b 

a 

a 


b 

b 

b 

a 

b 

b 

b 

a 

b 

b 

a 

b 

a 

b 

a 


b 

b 

b 

b 

a 

b 

b 

b 

a 

b 

b 

a 

a 

a 

b 


Runs 

2 

4 

4 

4 
3 

3 

5 
5 

4 

3 

5 

4 
2 
4 
3 
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b ) 

Sampling distribution 
1/ f 

2 2 

3 4 

4 6 

5 3 

0 


Probabili 

ty distribution 

V 

Pr{M} 

2 

0.133 

3 

0.267 

4 

0.4 

5 

0.2 

Mean V 

3.667 

Variance 

V 0.888 


17.62 Supóngase que los renglones se leen uno por uno. Es decir, primero el renglón 1, luego el renglón 2, luego el renglón 3 y 
finalmente el renglón 4. 

Prueba de corridas: Calificaciones 

Runs test for Grade 

Runs above and below K= 69 

The observed number of runs = 26 

The expected number of runs = 20.95 

21 observations above K, 19 below 

P-value =0.105 

Al nivel de significancia 0.05 puede suponerse que las calificaciones se registraron en forma aleatoria. 

17.63 Supóngase que los datos se registraron renglón por renglón. 

Runs test for price 
Runs above and below K= 11.36 
The observed number of runs = 10 
The expected number of runs = 13.32 
14 observations above K, 11 below 
P-value = 0.168 

AI nivel de significancia 0.05 puede suponerse que los precios son aleatorios. 

17.64 En los dígitos después del punto decimal, considérese que 0 representa a un dígito par y 1 representa un dígito non. 

Runs test for digit 

Runs above and below K = 0.473 684 

The observed number of runs = 9 

The expected number o f runs = 10.4737 

9 observations above K, 10 below 

* N is small, so the following approximation may be invalid. 

P-value = 0.485 

AI nivel de significancia 0.05 puede suponerse que los dígitos son aleatorios. 

17.65 AI nivel de significancia 0.05 puede suponerse que los dígitos son aleatorios. 
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17.66 Usando la aproximación normal, el valor calculado para Z es -1.62. Empleando EXCEL, el valor p calculado es 
=2* ÑORMSDI ST( -1. 62) quees0.105. 

17.67 Usando la aproximación normal, el valor calculado para Z es -1.38. Empleando EXCEL, el valor p calculado es 
=2* ÑORMSDI ST( -1. 38) queesO.168. 

17.68 Usando la aproximación normal, el valor calculado para Z es -0.70. Empleando EXCEL, el valor p calculado es 
=2* ÑORM5DI ST( -0. 7 0) queesO.484. 

17.70 Correlación de rangos de Spearman = 1.0 y coeficiente de correlación de Pearson = 0.998. 


CAPÍTULO 18 

18.16 Medias de los subgrupos: 13.25 14.50 17.25 14.50 13.50 14.75 13.75 15.00 15.00 17.00 
Rangos de los subgrupos: 595689 10 557 

X = 14 . 85 , R = 6 . 9 . 

18.17 La estimación conjunta de a es 1.741. LCL = 450.7, UCL = 455.9. Ninguna de las medias de los subgrupos está fuera de 
los límites de control. 

18.18 No. 

18.19 La gráfica indica que ha disminuido la variabilidad. Los nuevos límites de control son LCL =452.9 y UCL = 455.2. Después 
de la modificación, también parece que el proceso se ha centrado más próximo al valor objetivo. 

18.20 Los límites de control son LCL = 1.980 y UCL = 2.017. Los periodos 4, 5 y 6 no satisfacen la prueba 5. Los periodos 15 
a 20 no satisfacen la prueba 4. Cada uno de estos puntos es el último de 14 puntos consecutivos alternantes hacia arriba y 
hacia abajo. 

18.21 C PK = 0.63. ppm de no conformes = 32 487. 

18.22 C PK = 1.72. ppm de no conformes = menos de 1. 

18.23 Línea central = 0.006133, LCL = 0, UCL = 0.01661. El proceso está bajo control, ppm = 6 133. 

18.24 Línea central = 3.067, LCL = 0, UCL = 8.304. 

18.25 0.032 0.027 0.032 0.024 0.024 0.027 0.032 0.032 0.027 0.024 0.032 0.024 

0.027 0.024 0.027 0.024 0.027 0.027 0.027 0.027 

18.26 Línea central X = 349.9. 

Rangos móviles: 0.0 0.2 0.6 0.8 0.4 0.3 0.1 0.4 0.4 0.9 0.2 1.1 0.5 1.5 2.8 1.6 0.3 0.1 1.2 1.9 0.2 
1.2 0.9 

M edia de los anteriores rangos móviles = = 0.765. 

Límites de control de la gráfica de mediciones individuales X ± 3 (R M /d 2 ). d 2 es una constante de la gráfica de 
mediciones individuales que se obtiene de tablas de diversas fuentes y que en este caso es igual a 1.128. LCL = 347.9 y 
UCL = 352.0. 

18.27 La gráfica EWM A indica que las medias del proceso se encuentran constantemente abajo del valor objetivo. Las medias de 
los subgrupos 12 y 13 caen abajo de los límites de control inferior. Las medias de los grupos después del 13 están arriba de 
los límites inferiores de control; pero la media del proceso sigue estando abajo del valor objetivo. 

18.28 La gráfica de zonas no indica que haya alguna situación fuera de control. Sin embargo, como se ve en el problema 18.20, 
hay 14 puntos consecutivos alternando hacia arriba y hacia abajo. Dada la manera en que funciona una gráfica de zonas, 
ésta no indica esta situación. 
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18.29 Los 20 límites de control inferiores son: 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.38 0.00 0.00 0.00 0.00 0.00 0.38 0.00 
0.00 0.38 0.00 0.38 0.38. 

Los 20 límites de control superiores son: 9.52 9.52 9.52 9.52 9.52 7.82 8.46 7.07 7.82 8.46 9.52 9.52 9.52 
7.07 9.52 9.52 7.07 9.52 7.07 7.07. 

18.30 Decoloración; decoloración y pérdida del tirante. 
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Apéndice I 


Ordenadas(/) 
en z, 

en la curva 
normal 
estándar 



z 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

0.0 

.3989 

.3989 

.3989 

.3988 

.3986 

.3984 

.3982 

.3980 

.3977 

.3973 

0.1 

.3970 

.3965 

.3961 

.3956 

.3951 

.3945 

.3939 

.3932 

.3925 

.3918 

0.2 

.3910 

.3902 

.3894 

.3885 

.3876 

.3867 

.3857 

.3847 

.3836 

.3825 

0.3 

.3814 

.3802 

.3790 

.3778 

.3765 

.3752 

.3739 

.3725 

.3712 

.3697 

0.4 

.3683 

.3668 

.3653 

.3637 

.3621 

.3605 

.3589 

.3572 

.3555 

.3538 

0.5 

.3521 

.3503 

.3485 

.3467 

.3448 

.3429 

.3410 

.3391 

.3372 

.3352 

0.6 

.3332 

.3312 

.3292 

.3271 

.3251 

.3230 

.3209 

.3187 

.3166 

.3144 

0.7 

.3123 

.3101 

.3079 

.3056 

.3034 

.3011 

.2989 

.2966 

.2943 

.2920 

0.8 

.2897 

.2874 

.2850 

.2827 

.2803 

.2780 

.2756 

.2732 

.2709 

.2685 

0.9 

.2661 

.2637 

.2613 

.2589 

.2565 

.2541 

.2516 

.2492 

.2468 

.2444 

1.0 

.2420 

.2396 

.2371 

.2347 

.2323 

.2299 

.2275 

.2251 

.2227 

.2203 

1.1 

.2179 

.2155 

.2131 

.2107 

.2083 

.2059 

.2036 

.2012 

.1989 

.1965 

1.2 

.1942 

.1919 

.1895 

.1872 

.1849 

.1826 

.1804 

.1781 

.1758 

.1736 

1.3 

.1714 

.1691 

.1669 

.1647 

.1626 

.1604 

.1582 

.1561 

.1539 

.1518 

1.4 

.1497 

.1476 

.1456 

.1435 

.1415 

.1394 

.1374 

.1354 

.1334 

.1315 

1.5 

.1295 

.1276 

.1257 

.1238 

.1219 

.1200 

.1182 

.1163 

.1145 

.1127 

1.6 

.1109 

.1092 

.1074 

.1057 

.1040 

.1023 

.1006 

.0989 

.0973 

.0957 

1.7 

.0940 

.0925 

.0909 

.0893 

.0878 

.0863 

.0848 

.0833 

.0818 

.0804 

1.8 

.0790 

.0775 

.0761 

.0748 

.0734 

.0721 

.0707 

.0694 

.0681 

.0669 

1.9 

.0656 

.0644 

.0632 

.0620 

.0608 

.0596 

.0584 

.0573 

.0562 

.0551 

2.0 

.0540 

.0529 

.0519 

.0508 

.0498 

.0488 

.0478 

.0468 

.0459 

.0449 

2.1 

.0440 

.0431 

.0422 

.0413 

.0404 

.0396 

.0387 

.0379 

.0371 

.0363 

2.2 

.0355 

.0347 

.0339 

.0332 

.0325 

.0317 

.0310 

.0303 

.0297 

.0290 

2.3 

.0283 

.0277 

.0270 

.0264 

.0258 

.0252 

.0246 

.0241 

.0235 

.0229 

2.4 

.0224 

.0219 

.0213 

.0208 

.0203 

.0198 

.0194 

.0189 

.0184 

.0180 

2.5 

.0175 

.0171 

.0167 

.0163 

.0158 

.0154 

.0151 

.0147 

.0143 

.0139 

2.6 

.0136 

.0132 

.0129 

.0126 

.0122 

.0119 

.0116 

.0113 

.0110 

.0107 

2.7 

.0104 

.0101 

.0099 

.0096 

.0093 

.0091 

.0088 

.0086 

.0084 

.0081 

2.8 

.0079 

.0077 

.0075 

.0073 

.0071 

.0069 

.0067 

.0065 

.0063 

.0061 

2.9 

.0060 

.0058 

.0056 

.0055 

.0053 

.0051 

.0050 

.0048 

.0047 

.0046 

3.0 

.0044 

.0043 

.0042 

.0040 

.0039 

.0038 

.0037 

.0036 

.0035 

.0034 

3.1 

.0033 

.0032 

.0031 

.0030 

.0029 

.0028 

.0027 

.0026 

.0025 

.0025 

3.2 

.0024 

.0023 

.0022 

.0022 

.0021 

.0020 

.0020 

.0019 

.0018 

.0018 

3.3 

.0017 

.0017 

.0016 

.0016 

.0015 

.0015 

.0014 

.0014 

.0013 

.0013 

3.4 

.0012 

.0012 

.0012 

.0011 

.0011 

.0010 

.0010 

.0010 

.0009 

.0009 

3.5 

.0009 

.0008 

.0008 

.0008 

.0008 

.0007 

.0007 

.0007 

.0007 

.0006 

3.6 

.0006 

.0006 

.0006 

.0005 

.0005 

.0005 

.0005 

.0005 

.0005 

.0004 

3.7 

.0004 

.0004 

.0004 

.0004 

.0004 

.0004 

.0003 

.0003 

.0003 

.0003 

3.8 

.0003 

.0003 

.0003 

.0003 

.0003 

.0002 

.0002 

.0002 

.0002 

.0002 

3.9 

.0002 

.0002 

.0002 

.0002 

.0002 

.0002 

.0002 

.0002 

.0001 

.0001 
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Apéndice II 


Áreas bajo 
la curva 

normal estándar, 
desde 0 
hasta z 



z 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

0.0 

.0000 

.0040 

.0080 

.0120 

.0160 

.0199 

.0239 

.0279 

.0319 

.0359 

0.1 

.0398 

.0438 

.0478 

.0517 

.0557 

.0596 

.0636 

.0675 

.0714 

.0754 

0.2 

.0793 

.0832 

.0871 

.0910 

.0948 

.0987 

.1026 

.1064 

.1103 

.1141 

0.3 

.1179 

.1217 

.1255 

.1293 

.1331 

.1368 

.1406 

.1443 

.1480 

.1517 

0.4 

.1554 

.1591 

.1628 

.1664 

.1700 

.1736 

.1772 

.1808 

.1844 

.1879 

0.5 

.1915 

.1950 

.1985 

.2019 

.2054 

.2088 

.2123 

.2157 

.2190 

.2224 

0.6 

.2258 

.2291 

.2324 

.2357 

.2389 

.2422 

.2454 

.2486 

.2518 

.2549 

0.7 

.2580 

.2612 

.2642 

.2673 

.2704 

.2734 

.2764 

.2794 

.2823 

.2852 

0.8 

.2881 

.2910 

.2939 

.2967 

.2996 

.3023 

.3051 

.3078 

.3106 

.3133 

0.9 

.3159 

.3186 

.3212 

.3238 

.3264 

.3289 

.3315 

.3340 

.3365 

.3389 

1.0 

.3413 

.3438 

.3461 

.3485 

.3508 

.3531 

.3554 

.3577 

.3599 

.3621 

1.1 

.3643 

.3665 

.3686 

.3708 

.3729 

.3749 

.3770 

.3790 

.3810 

.3830 

1.2 

.3849 

.3869 

.3888 

.3907 

.3925 

.3944 

.3962 

.3980 

.3997 

.4015 

1.3 

.4032 

.4049 

.4066 

.4082 

.4099 

.4115 

.4131 

.4147 

.4162 

.4177 

1.4 

.4192 

.4207 

.4222 

.4236 

.4251 

.4265 

.4279 

.4292 

.4306 

.4319 

1.5 

.4332 

.4345 

.4357 

.4370 

.4382 

.4394 

.4406 

.4418 

.4429 

.4441 

1.6 

.4452 

.4463 

.4474 

.4484 

.4495 

.4505 

.4515 

.4525 

.4535 

.4545 

1.7 

.4554 

.4564 

.4573 

.4582 

.4591 

.4599 

.4608 

.4616 

.4625 

.4633 

1.8 

.4641 

.4649 

.4656 

.4664 

.4671 

.4678 

.4686 

.4693 

.4699 

.4706 

1.9 

.4713 

.4719 

.4726 

.4732 

.4738 

.4744 

.4750 

.4756 

.4761 

.4767 

2.0 

.4772 

.4778 

.4783 

.4788 

.4793 

.4798 

.4803 

.4808 

.4812 

.4817 

2.1 

.4821 

.4826 

.4830 

.4834 

.4838 

.4842 

.4846 

.4850 

.4854 

.4857 

2.2 

.4861 

.4864 

.4868 

.4871 

.4875 

.4878 

.4881 

.4884 

.4887 

.4890 

2.3 

.4893 

.4896 

.4898 

.4901 

.4904 

.4906 

.4909 

.4911 

.4913 

.4916 

2.4 

.4918 

.4920 

.4922 

.4925 

.4927 

.4929 

.4931 

.4932 

.4934 

.4936 

2.5 

.4938 

.4940 

.4941 

.4943 

.4945 

.4946 

.4948 

.4949 

.4951 

.4952 

2.6 

.4953 

.4955 

.4956 

.4957 

.4959 

.4960 

.4961 

.4962 

.4963 

.4964 

2.7 

.4965 

.4966 

.4967 

.4968 

.4969 

.4970 

.4971 

.4972 

.4973 

.4974 

2.8 

.4974 

.4975 

.4976 

.4977 

.4977 

.4978 

.4979 

.4979 

.4980 

.4981 

2.9 

.4981 

.4982 

.4982 

.4983 

.4984 

.4984 

.4985 

.4985 

.4986 

4986 

3.0 

.4987 

.4987 

.4987 

.4988 

.4988 

.4989 

.4989 

.4989 

.4990 

.4990 

3.1 

.4990 

.4991 

.4991 

.4991 

.4992 

.4992 

.4992 

.4992 

.4993 

.4993 

3.2 

.4993 

.4993 

.4994 

.4994 

.4994 

.4994 

.4994 

.4995 

.4995 

.4995 

3.3 

.4995 

.4995 

.4995 

.4996 

.4996 

.4996 

.4996 

.4996 

.4996 

.4997 

3.4 

.4997 

.4997 

.4997 

.4997 

.4997 

.4997 

.4997 

.4997 

.4997 

.4998 

3.5 

.4998 

.4998 

.4998 

.4998 

.4998 

.4998 

.4998 

.4998 

.4998 

.4998 

3.6 

.4998 

.4998 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

3.7 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

3.8 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

.4999 

3.9 

.5000 

.5000 

.5000 

.5000 

.5000 

.5000 

.5000 

.5000 

.5000 

.5000 
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Apéndice III 


Valores percentiles (í p ) 
correspondientes a 
la distribución f de Student 
con v grados de libertad 
(área sombreada = p) 



V 

1.995 

1.99 

1.975 

1.95 

1.90 

680 

¿75 

t.70 

1.60 

1.55 

1 

63.66 

31.82 

12.71 

6.31 

3.08 

1.376 

1.000 

.727 

.325 

.158 

2 

9.92 

6.96 

4.30 

2.92 

1.89 

1.061 

.816 

.617 

.289 

.142 

3 

5.84 

4.54 

3.18 

2.35 

1.64 

.978 

.765 

.584 

.277 

.137 

4 

4.60 

3.75 

2.78 

2.13 

1.53 

.941 

.741 

.569 

.271 

.134 

5 

4.03 

3.36 

2.57 

2.02 

1.48 

.920 

.727 

.559 

.267 

.132 

6 

3.71 

3.14 

2.45 

1.94 

1.44 

.906 

.718 

.553 

.265 

.131 

7 

3.50 

3.00 

2.36 

1.90 

1.42 

.896 

.711 

.549 

.263 

.130 

8 

3.36 

2.90 

2.31 

1.86 

1.40 

.889 

.706 

.546 

.262 

.130 

9 

3.25 

2.82 

2.26 

1.83 

1.38 

.883 

.703 

.543 

.261 

.129 

10 

3.17 

2.76 

2.23 

1.81 

1.37 

.879 

.700 

.542 

.260 

.129 

11 

3.11 

2.72 

2.20 

1.80 

1.36 

.876 

.697 

.540 

.260 

.129 

12 

3.06 

2.68 

2.18 

1.78 

1.36 

.873 

.695 

.539 

.259 

.128 

13 

3.01 

2.65 

2.16 

1.77 

1.35 

.870 

.694 

.538 

.259 

.128 

14 

2.98 

2.62 

2.14 

1.76 

1.34 

.868 

.692 

.537 

.258 

.128 

15 

2.95 

2.60 

2.13 

1.75 

1.34 

.866 

.691 

.536 

.258 

.128 

16 

2.92 

2.58 

2.12 

1.75 

1.34 

.865 

.690 

.535 

.258 

.128 

17 

2.90 

2.57 

2.11 

1.74 

1.33 

.863 

.689 

.534 

.257 

.128 

18 

2.88 

2.55 

2.10 

1.73 

1.33 

.862 

.688 

.534 

.257 

.127 

19 

2.86 

2.54 

2.09 

1.73 

1.33 

.861 

.688 

.533 

.257 

.127 

20 

2.84 

2.53 

2.09 

1.72 

1.32 

.860 

.687 

.533 

.257 

.127 

21 

2.83 

2.52 

2.08 

1.72 

1.32 

.859 

.686 

.532 

.257 

.127 

22 

2.82 

2.51 

2.07 

1.72 

1.32 

.858 

.686 

.532 

.256 

.127 

23 

2.81 

2.50 

2.07 

1.71 

1.32 

.858 

.685 

.532 

.256 

.127 

24 

2.80 

2.49 

2.06 

1.71 

1.32 

.857 

.685 

.531 

.256 

.127 

25 

2.79 

2.48 

2.06 

1.71 

1.32 

.856 

.684 

.531 

.256 

.127 

26 

2.78 

2.48 

2.06 

1.71 

1.32 

.856 

.684 

.531 

.256 

.127 

27 

2.77 

2.47 

2.05 

1.70 

1.31 

.855 

.684 

.531 

.256 

.127 

28 

2.76 

2.47 

2.05 

1.70 

1.31 

.855 

.683 

.530 

.256 

.127 

29 

2.76 

2.46 

2.04 

1.70 

1.31 

.854 

.683 

.530 

.256 

.127 

30 

2.75 

2.46 

2.04 

1.70 

1.31 

.854 

.683 

.530 

.256 

.127 

40 

2.70 

2.42 

2.02 

1.68 

1.30 

.851 

.681 

.529 

.255 

.126 

60 

2.66 

2.39 

2.00 

1.67 

1.30 

.848 

.679 

.527 

.254 

.126 

120 

2.62 

2.36 

1.98 

1.66 

1.29 

.845 

.677 

.526 

.254 

.126 

CX) 

2.58 

2.33 

1.96 

1.645 

1.28 

.842 

.674 

.524 

.253 

.126 


Fuente: R . A . Fisher y F . Yates , Statistical Tables for Biológica!, AgriculturaI and Medical Research (Tablas de estadísticas para la Investi ¬ 
gación biológica , agrícola y médica ) ( 5 a . edición ), Tabla III , Oliver and Boyd Ltd ., Edinburgh , con autorización de los autores y editores . 
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Apéndice IV 


Valores percentiles ( x 2 p ) 
correspondientes 
a la distribución ji cuadrada 
con v grados de libertad 
(área sombreada = p) 



V 

2 

X.995 

, 2 
X.99 

,\ 2 975 

„ 2 
X.95 

X%0 

Xj5 

2 

X.50 

X 2 25 

2 

X.io 

2 

X.05 

, 2 
X.025 

2 

X.oi 

, 2 

X.005 

1 

7.88 

6.63 

5.02 

3.84 

2.71 

1.32 

.455 

.102 

.0158 

.0039 

.0010 

.0002 

.0000 

2 

10.6 

9.21 

7.38 

5.99 

4.61 

2.77 

1.39 

.575 

.211 

.103 

.0506 

.0201 

.0100 

3 

12.8 

11.3 

9.35 

7.81 

6.25 

4.11 

2.37 

1.21 

.584 

.352 

.216 

.115 

.072 

4 

14.9 

13.3 

11.1 

9.49 

7.78 

5.39 

3.36 

1.92 

1.06 

.711 

.484 

.297 

.207 

5 

16.7 

15.1 

12.8 

11.1 

9.24 

6.63 

4.35 

2.67 

1.61 

1.15 

.831 

.554 

.412 

6 

18.5 

16.8 

14.4 

12.6 

10.6 

7.84 

5.35 

3.45 

2.20 

1.64 

1.24 

.872 

.676 

7 

20.3 

18.5 

16.0 

14.1 

12.0 

9.04 

6.35 

4.25 

2.83 

2.17 

1.69 

1.24 

.989 

8 

22.0 

20.1 

17.5 

15.5 

13.4 

10.2 

7.34 

5.07 

3.49 

2.73 

2.18 

1.65 

1.34 

9 

23.6 

21.7 

19.0 

16.9 

14.7 

11.4 

8.34 

5.90 

4.17 

3.33 

2.70 

2.09 

1.73 

10 

25.2 

23.2 

20.5 

18.3 

16.0 

12.5 

9.34 

6.74 

4.87 

3.94 

3.25 

2.56 

2.16 

11 

26.8 

24.7 

21.9 

19.7 

17.3 

13.7 

10.3 

7.58 

5.58 

4.57 

3.82 

3.05 

2.60 

12 

28.3 

26.2 

23.3 

21.0 

18.5 

14.8 

11.3 

8.44 

6.30 

5.23 

4.40 

3.57 

3.07 

13 

29.8 

27.7 

24.7 

22.4 

19.8 

16.0 

12.3 

9.30 

7.04 

5.89 

5.01 

4.11 

3.57 

14 

31.3 

29.1 

26.1 

23.7 

21.1 

17.1 

13.3 

10.2 

7.79 

6.57 

5.63 

4.66 

4.07 

15 

32.8 

30.6 

27.5 

25.0 

22.3 

18.2 

14.3 

11.0 

8.55 

7.26 

6.26 

5.23 

4.60 

16 

34.3 

32.0 

28.8 

26.3 

23.5 

19.4 

15.3 

11.9 

9.31 

7.96 

6.91 

5.81 

5.14 

17 

35.7 

33.4 

30.2 

27.6 

24.8 

20.5 

16.3 

12.8 

10.1 

8.67 

7.56 

6.41 

5.70 

18 

37.2 

34.8 

31.5 

28.9 

26.0 

21.6 

17.3 

13.7 

10.9 

9.39 

8.23 

7.01 

6.26 

19 

38.6 

36.2 

32.9 

30.1 

27.2 

22.7 

18.3 

14.6 

11.7 

10.1 

8.91 

7.63 

6.84 

20 

40.0 

37.6 

34.2 

31.4 

28.4 

23.8 

19.3 

15.5 

12.4 

10.9 

9.59 

8.26 

7.43 

21 

41.4 

38.9 

35.5 

32.7 

29.6 

24.9 

20.3 

16.3 

13.2 

11.6 

10.3 

8.90 

8.03 

22 

42.8 

40.3 

36.8 

33.9 

30.8 

26.0 

21.3 

17.2 

14.0 

12.3 

11.0 

9.54 

8.64 

23 

44.2 

41.6 

38.1 

35.2 

32.0 

27.1 

22.3 

18.1 

14.8 

13.1 

11.7 

10.2 

9.26 

24 

45.6 

43.0 

39.4 

36.4 

33.2 

28.2 

23.3 

19.0 

15.7 

13.8 

12.4 

10.9 

9.89 

25 

46.9 

44.3 

40.6 

37.7 

34.4 

29.3 

24.3 

19.9 

16.5 

14.6 

13.1 

11.5 

10.5 

26 

48.3 

45.6 

41.9 

38.9 

35.6 

30.4 

25.3 

20.8 

17.3 

15.4 

13.8 

12.2 

11.2 

27 

49.6 

47.0 

43.2 

40.1 

36.7 

31.5 

26.3 

21.7 

18.1 

16.2 

14.6 

12.9 

11.8 

28 

51.0 

48.3 

44.5 

41.3 

37.9 

32.6 

27.3 

22.7 

18.9 

16.9 

15.3 

13.6 

12.5 

29 

52.3 

49.6 

45.7 

42.6 

39.1 

33.7 

28.3 

23.6 

19.8 

17.7 

16.0 

14.3 

13.1 

30 

53.7 

50.9 

47.0 

43.8 

40.3 

34.8 

29.3 

24.5 

20.6 

18.5 

16.8 

15.0 

13.8 

40 

66.8 

63.7 

59.3 

55.8 

51.8 

46.6 

39.3 

33.7 

29.1 

26.5 

24.4 

22.2 

20.7 

50 

79.5 

76.2 

71.4 

67.5 

63.2 

56.3 

49.3 

42.9 

37.7 

34.8 

32.4 

29.7 

28.0 

60 

92.0 

88.4 

83.3 

79.1 

74.4 

67.0 

59.3 

52.3 

46.5 

43.2 

40.5 

37.5 

35.5 

70 

104.2 

100.4 

95.0 

90.5 

85.5 

77.6 

69.3 

61.7 

55.3 

51.7 

48.8 

45.4 

43.3 

80 

116.3 

112.3 

106.6 

101.9 

96.6 

88.1 

79.3 

71.1 

64.3 

60.4 

57.2 

53.5 

51.2 

90 

128.3 

124.1 

118.1 

113.1 

107.6 

98.6 

89.3 

80.6 

73.3 

69.1 

65.6 

61.8 

59.2 

100 

140.2 

135.8 

129.6 

124.3 

118.5 

109.1 

99.3 

90.1 

82.4 

77.9 

74.2 

70.1 

67.3 


Fuente: CatherineM . Thompson, Table ofpercentage points ofthex 2 distribution. Biometrika, vol. 32 (1941) con autorización de autor y 
editor. 
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Apéndice V 


Valores del percentil 95 
correspondientes 
a la distribución F 

(v-f grados de libertad en el numerador) 
(u 2 grados de libertad en el denominador) 



x \"l 

"2 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

12 

15 

20 

24 

30 

40 

60 

120 

00 

1 

161 

200 

216 

225 

230 

234 

237 

239 

241 

242 

244 

246 

248 

249 

250 

251 

252 

253 

254 

2 

18.5 

19.0 

19.2 

19.2 

19.3 

19.3 

19.4 

19.4 

19.4 

19.4 

19.4 

19.4 

19.4 

19.5 

19.5 

19.5 

19.5 

19.5 

19.5 

3 

10.1 

9.55 

9.28 

9.12 

9.01 

8.94 

8.89 

8.85 

8.81 

8.79 

8.74 

8.70 

8.66 

8.64 

8.62 

8.59 

8.57 

8.55 

8.53 

4 

7.71 

6.94 

6.59 

6.39 

6.26 

6.16 

6.09 

6.04 

6.00 

5.96 

5.91 

5.86 

5.80 

5.77 

5.75 

5.72 

5.69 

5.66 

5.63 

5 

6.61 

5.79 

5.41 

5.19 

5.05 

4.95 

4.88 

4.82 

4.77 

4.74 

4.68 

4.62 

4.56 

4.53 

4.50 

4.46 

4.43 

4.40 

4.37 

6 

5.99 

5.14 

4.76 

4.53 

4.39 

4.28 

4.21 

4.15 

4.10 

4.06 

4.00 

3.94 

3.87 

3.84 

3.81 

3.77 

3.74 

3.70 

3.67 

7 

5.59 

4.74 

4.35 

4.12 

3.97 

3.87 

3.79 

3.73 

3.68 

3.64 

3.57 

3.51 

3.44 

3.41 

3.38 

3.34 

3.30 

3.27 

3.23 

8 

5.32 

4.46 

4.07 

3.84 

3.69 

3.58 

3.50 

3.44 

3.39 

3.35 

3.28 

3.22 

3.15 

3.12 

3.08 

3.04 

3.01 

2.97 

2.93 

9 

5.12 

4.26 

3.86 

3.63 

3.48 

3.37 

3.29 

3.23 

3.18 

3.14 

3.07 

3.01 

2.94 

2.90 

2.86 

2.83 

2.79 

2.75 

2.71 

10 

4.96 

4.10 

3.71 

3.48 

3.33 

3.22 

3.14 

3.07 

3.02 

2.98 

2.91 

2.85 

2.77 

2.74 

2.70 

2.66 

2.62 

2.58 

2.54 

11 

4.84 

3.98 

3.59 

3.36 

3.20 

3.09 

3.01 

2.95 

2.90 

2.85 

2.79 

2.72 

2.65 

2.61 

2.57 

2.53 

2.49 

2.45 

2.40 

12 

4.75 

3.89 

3.49 

3.26 

3.11 

3.00 

2.91 

2.85 

2.80 

2.75 

2.69 

2.62 

2.54 

2.51 

2.47 

2.43 

2.38 

2.34 

2.30 

13 

4.67 

3.81 

3.41 

3.18 

3.03 

2.92 

2.83 

2.77 

2.71 

2.67 

2.60 

2.53 

2.46 

2.42 

2.38 

2.34 

2.30 

2.25 

2.21 

14 

4.60 

3.74 

3.34 

3.11 

2.96 

2.85 

2.76 

2.70 

2.65 

2.60 

2.53 

2.46 

2.39 

2.35 

2.31 

2.27 

2.22 

2.18 

2.13 

15 

4.54 

3.68 

3.29 

3.06 

2.90 

2.79 

2.71 

2.64 

2.59 

2.54 

2.48 

2.40 

2.33 

2.29 

2.25 

2.20 

2.16 

2.11 

2.07 

16 

4.49 

3.63 

3.24 

3.01 

2.85 

2.74 

2.66 

2.59 

2.54 

2.49 

2.42 

2.35 

2.28 

2.24 

2.19 

2.15 

2.11 

2.06 

2.01 

17 

4.45 

3.59 

3.20 

2.96 

2.81 

2.70 

2.61 

2.55 

2.49 

2.45 

2.38 

2.31 

2.23 

2.19 

2.15 

2.10 

2.06 

2.01 

1.96 

18 

4.41 

3.55 

3.16 

2.93 

2.77 

2.66 

2.58 

2.51 

2.46 

2.41 

2.34 

2.27 

2.19 

2.15 

2.11 

2.06 

2.02 

1.97 

1.92 

19 

4.38 

3.52 

3.13 

2.90 

2.74 

2.63 

2.54 

2.48 

2.42 

2.38 

2.31 

2.23 

2.16 

2.11 

2.07 

2.03 

1.98 

1.93 

1.88 

20 

4.35 

3.49 

3.10 

2.87 

2.71 

2.60 

2.51 

2.45 

2.39 

2.35 

2.28 

2.20 

2.12 

2.08 

2.04 

1.99 

1.95 

1.90 

1.84 

21 

4.32 

3.47 

3.07 

2.84 

2.68 

2.57 

2.49 

2.42 

2.37 

2.32 

2.25 

2.18 

2.10 

2.05 

2.01 

1.96 

1.92 

1.87 

1.81 

22 

4.30 

3.44 

3.05 

2.82 

2.66 

2.55 

2.46 

2.40 

2.34 

2.30 

2.23 

2.15 

2.07 

2.03 

1.98 

1.94 

1.89 

1.84 

1.78 

23 

4.28 

3.42 

3.03 

2.80 

2.64 

2.53 

2.44 

2.37 

2.32 

2.27 

2.20 

2.13 

2.05 

2.01 

1.96 

1.91 

1.86 

1.81 

1.76 

24 

4.26 

3.40 

3.01 

2.78 

2.62 

2.51 

2.42 

2.36 

2.30 

2.25 

2.18 

2.11 

2.03 

1.98 

1.94 

1.89 

1.84 

1.79 

1.73 

25 

4.24 

3.39 

2.99 

2.76 

2.60 

2.49 

2.40 

2.34 

2.28 

2.24 

2.16 

2.09 

2.01 

1.96 

1.92 

1.87 

1.82 

1.77 

1.71 

26 

4.23 

3.37 

2.98 

2.74 

2.59 

2.47 

2.39 

2.32 

2.27 

2.22 

2.15 

2.07 

1.99 

1.95 

1.90 

1.85 

1.80 

1.75 

1.69 

27 

4.21 

3.35 

2.96 

2.73 

2.57 

2.46 

2.37 

2.31 

2.25 

2.20 

2.13 

2.06 

1.97 

1.93 

1.88 

1.84 

1.79 

1.73 

1.67 

28 

4.20 

3.34 

2.95 

2.71 

2.56 

2.45 

2.36 

2.29 

2.24 

2.19 

2.12 

2.04 

1.96 

1.91 

1.87 

1.82 

1.77 

1.71 

1.65 

29 

4.18 

3.33 

2.93 

2.70 

2.55 

2.43 

2.35 

2.28 

2.22 

2.18 

2.10 

2.03 

1.94 

1.90 

1.85 

1.81 

1.75 

1.70 

1.64 

30 

4.17 

3.32 

2.92 

2.69 

2.53 

2.42 

2.33 

2.27 

2.21 

2.16 

2.09 

2.01 

1.93 

1.89 

1.84 

1.79 

1.74 

1.68 

1.62 

40 

4.08 

3.23 

2.84 

2.61 

2.45 

2.34 

2.25 

2.18 

2.12 

2.08 

2.00 

1.92 

1.84 

1.79 

1.74 

1.69 

1.64 

1.58 

1.51 

60 

4.00 

3.15 

2.76 

2.53 

2.37 

2.25 

2.17 

2.10 

2.04 

1.99 

1.92 

1.84 

1.75 

1.70 

1.65 

1.59 

1.53 

1.47 

1.39 

120 

3.92 

3.07 

2.68 

2.45 

2.29 

2.18 

2.09 

2.02 

1.96 

1.91 

1.83 

1.75 

1.66 

1.61 

1.55 

1.50 

1.43 

1.35 

1.25 

00 

3.84 

3.00 

2.60 

2.37 

2.21 

2.10 

2.01 

1.94 

1.88 

1.83 

1.75 

1.67 

1.57 

1.52 

1.46 

1.39 

1.32 

1.22 

1.00 


Fuente: E. S. Pearson y H. 0. Hartley, Biometrika Table for Statísticians, vol. 2 (1972), tabla 5, página 178, con autorización. 
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Apéndice VI 


Valores del percentil 99 
correspondientes 
a la distribución F 

(//., grados de libertad en el numerador) 
(u 2 grados de libertad en el denominador) 


N V'i 
"2 \ 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

12 

15 

20 

24 

30 

40 

60 

120 

OO 

1 

4052 

5000 

5403 

5625 

5764 

5859 

5928 

5981 

6023 

6056 

6106 

6157 

6209 

6235 

6261 

6287 

6313 

6339 

6366 

2 

98.5 

99.0 

99.2 

99.2 

99.3 

99.3 

99.4 

99.4 

99.4 

99.4 

99.4 

99.4 

99.4 

99.5 

99.5 

99.5 

99.5 

99.5 

99.5 

3 

34.1 

30.8 

29.5 

28.7 

28.2 

27.9 

27.7 

27.5 

27.3 

27.2 

27.1 

26.9 

26.7 

26.6 

26.5 

26.4 

26.3 

26.2 

26.1 

4 

21.2 

18.0 

16.7 

16.0 

15.5 

15.2 

15.0 

14.8 

14.7 

14.5 

14.4 

14.2 

14.0 

13.9 

13.8 

13.7 

13.7 

13.6 

13.5 

5 

16.3 

13.3 

12.1 

11.4 

11.0 

10.7 

10.5 

10.3 

10.2 

10.1 

9.89 

9.72 

9.55 

9.47 

9.38 

9.29 

9.20 

9.11 

9.02 

6 

13.7 

10.9 

9.78 

9.15 

8.75 

8.47 

8.26 

8.10 

7.98 

7.87 

7.72 

7.56 

7.40 

7.31 

7.23 

7.14 

7.06 

6.97 

6.88 

7 

12.2 

9.55 

8.45 

7.85 

7.46 

7.19 

6.99 

6.84 

6.72 

6.62 

6.47 

6.31 

6.16 

6.07 

5.99 

5.91 

5.82 

5.74 

5.65 

8 

11.3 

8.65 

7.59 

7.01 

6.63 

6.37 

6.18 

6.03 

5.91 

5.81 

5.67 

5.52 

5.36 

5.28 

5.20 

5.12 

5.03 

4.95 

4.86 

9 

10.6 

8.02 

6.99 

6.42 

6.06 

5.80 

5.61 

5.47 

5.35 

5.26 

5.11 

4.96 

4.81 

4.73 

4.65 

4.57 

4.48 

4.40 

4.31 

10 

10.0 

7.56 

6.55 

5.99 

5.64 

5.39 

5.20 

5.06 

4.94 

4.85 

4.71 

4.56 

4.41 

4.33 

4.25 

4.17 

4.08 

4.00 

3.91 

11 

9.65 

7.21 

6.22 

5.67 

5.32 

5.07 

4.89 

4.74 

4.63 

4.54 

4.40 

4.25 

4.10 

4.02 

3.94 

3.86 

3.78 

3.69 

3.60 

12 

9.33 

6.93 

5.95 

5.41 

5.06 

4.82 

4.64 

4.50 

4.39 

4.30 

4.16 

4.01 

3.86 

3.78 

3.70 

3.62 

3.54 

3.45 

3.36 

13 

9.07 

6.70 

5.74 

5.21 

4.86 

4.62 

4.44 

4.30 

4.19 

4.10 

3.96 

3.82 

3.66 

3.59 

3.51 

3.43 

3.34 

3.25 

3.17 

14 

8.86 

6.51 

5.56 

5.04 

4.70 

4.46 

4.28 

4.14 

4.03 

3.94 

3.80 

3.66 

3.51 

3.43 

3.35 

3.27 

3.18 

3.09 

3.00 

15 

8.68 

6.36 

5.42 

4.89 

4.56 

4.32 

4.14 

4.00 

3.89 

3.80 

3.67 

3.52 

3.37 

3.29 

3.21 

3.13 

3.05 

2.96 

2.87 

16 

8.53 

6.23 

5.29 

4.77 

4.44 

4.20 

4.03 

3.89 

3.78 

3.69 

3.55 

3.41 

3.26 

3.18 

3.10 

3.02 

2.93 

2.84 

2.75 

17 

8.40 

6.11 

5.19 

4.67 

4.34 

4.10 

3.93 

3.79 

3.68 

3.59 

3.46 

3.31 

3.16 

3.08 

3.00 

2.92 

2.83 

2.75 

2.65 

18 

8.29 

6.01 

5.09 

4.58 

4.25 

4.01 

3.84 

3.71 

3.60 

3.51 

3.37 

3.23 

3.08 

3.00 

2.92 

2.84 

2.75 

2.66 

2.57 

19 

8.18 

5.93 

5.01 

4.50 

4.17 

3.94 

3.77 

3.63 

3.52 

3.43 

3.30 

3.15 

3.00 

2.92 

2.84 

2.76 

2.67 

2.58 

2.49 

20 

8.10 

5.85 

4.94 

4.43 

4.10 

3.87 

3.70 

3.56 

3.46 

3.37 

3.23 

3.09 

2.94 

2.86 

2.78 

2.69 

2.61 

2.52 

2.42 

21 

8.02 

5.78 

4.87 

4.37 

4.04 

3.81 

3.64 

3.51 

3.40 

3.31 

3.17 

3.03 

2.88 

2.80 

2.72 

2.64 

2.55 

2.46 

2.36 

22 

7.95 

5.72 

4.82 

4.31 

3.99 

3.76 

3.59 

3.45 

3.35 

3.26 

3.12 

2.98 

2.83 

2.75 

2.67 

2.58 

2.50 

2.40 

2.31 

23 

7.88 

5.66 

4.76 

4.26 

3.94 

3.71 

3.54 

3.41 

3.30 

3.21 

3.07 

2.93 

2.78 

2.70 

2.62 

2.54 

2.45 

2.35 

2.26 

24 

7.82 

5.61 

4.72 

4.22 

3.90 

3.67 

3.50 

3.36 

3.26 

3.17 

3.03 

2.89 

2.74 

2.66 

2.58 

2.49 

2.40 

2.31 

2.21 

25 

7.77 

5.57 

4.68 

4.18 

3.86 

3.63 

3.46 

3.32 

3.22 

3.13 

2.99 

2.85 

2.70 

2.62 

2.54 

2.45 

2.36 

2.27 

2.17 

26 

7.72 

5.53 

4.64 

4.14 

3.82 

3.59 

3.42 

3.29 

3.18 

3.09 

2.96 

2.82 

2.66 

2.58 

2.50 

2.42 

2.33 

2.23 

2.13 

27 

7.68 

5.49 

4.60 

4.11 

3.78 

3.56 

3.39 

3.26 

3.15 

3.06 

2.93 

2.78 

2.63 

2.55 

2.47 

2.38 

2.29 

2.20 

2.10 

28 

7.64 

5.45 

4.57 

4.07 

3.75 

3.53 

3.36 

3.23 

3.12 

3.03 

2.90 

2.75 

2.60 

2.52 

2.44 

2.35 

2.26 

2.17 

2.06 

29 

7.60 

5.42 

4.54 

4.04 

3.73 

3.50 

3.33 

3.20 

3.09 

3.00 

2.87 

2.73 

2.57 

2.49 

2.41 

2.33 

2.23 

2.14 

2.03 

30 

7.56 

5.39 

4.51 

4.02 

3.70 

3.47 

3.30 

3.17 

3.07 

2.98 

2.84 

2.70 

2.55 

2.47 

2.39 

2.30 

2.21 

2.11 

2.01 

40 

7.31 

5.18 

4.31 

3.83 

3.51 

3.29 

3.12 

2.99 

2.89 

2.80 

2.66 

2.52 

2.37 

2.29 

2.20 

2.11 

2.02 

1.92 

1.80 

60 

7.08 

4.98 

4.13 

3.65 

3.34 

3.12 

2.95 

2.82 

2.72 

2.63 

2.50 

2.35 

2.20 

2.12 

2.03 

1.94 

1.84 

1.73 

1.60 

120 

6.85 

4.79 

3.95 

3.48 

3.17 

2.96 

2.79 

2.66 

2.56 

2.47 

2.34 

2.19 

2.03 

1.95 

1.86 

1.76 

1.66 

1.53 

1.38 

OO 

6.63 

4.61 

3.78 

3.32 

3.02 

2.80 

2.64 

2.51 

2.41 

2.32 

2.18 

2.04 

1.88 

1.79 

1.70 

1.59 

1.47 

1.32 

1.00 


Fuente: E. S. Pearson y H. 0. Hartley, Biometrika Table fot Statisticians, vol. 2 (1972), tabla 5, página 180, con autorización. 
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Apéndice Vil 


Logaritmos comunes con cuatro cifras decimales 


N 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

1 

2 

Partes proporcionales 

3 4 5 6 7 

8 

9 

10 

0000 

0043 

0086 

0128 

0170 

0212 

0253 

0294 

0334 

0374 

4 

8 

12 

17 

21 

25 

29 

33 

37 

11 

0414 

0453 

0492 

0531 

0569 

0607 

0645 

0682 

0719 

0755 

4 

8 

11 

15 

19 

23 

26 

30 

34 

12 

0792 

0828 

0864 

0899 

0934 

0969 

1004 

1038 

1072 

1106 

3 

7 

10 

14 

17 

21 

24 

28 

31 

13 

1139 

1173 

1206 

1239 

1271 

1303 

1335 

1367 

1399 

1430 

3 

6 

10 

13 

16 

19 

23 

26 

29 

14 

1461 

1492 

1523 

1553 

1584 

1614 

1644 

1673 

1703 

1732 

3 

6 

9 

12 

15 

18 

21 

24 

27 

15 

1761 

1790 

1818 

1847 

1875 

1903 

1931 

1959 

1987 

2014 

3 

6 

8 

11 

14 

17 

20 

22 

25 

16 

2041 

2068 

2095 

2122 

2148 

2175 

2201 

2227 

2253 

2279 

3 

5 

8 

11 

13 

16 

18 

21 

24 

17 

2304 

2330 

2355 

2380 

2405 

2430 

2455 

2480 

2504 

2529 

2 

5 

7 

10 

12 

15 

17 

20 

22 

18 

2553 

2577 

2601 

2625 

2648 

2672 

2695 

2718 

2742 

2765 

2 

5 

7 

9 

12 

14 

16 

19 

21 

19 

2788 

2810 

2833 

2856 

2878 

2900 

2923 

2945 

2967 

2989 

2 

4 

7 

9 

11 

13 

16 

18 

20 

20 

3010 

3032 

3054 

3075 

3096 

3118 

3139 

3160 

3181 

3201 

2 

4 

6 

8 

11 

13 

15 

17 

19 

21 

3222 

3243 

3263 

3284 

3304 

3324 

3345 

3365 

3385 

3404 

2 

4 

6 

8 

10 

12 

14 

16 

18 

22 

3424 

3444 

3464 

3483 

3502 

3522 

3541 

3560 

3579 

3598 

2 

4 

6 

8 

10 

12 

14 

15 

17 

23 

3617 

3636 

3655 

3674 

3692 

3711 

3729 

3747 

3766 

3784 

2 

4 

6 

7 

9 

11 

13 

15 

17 

24 

3802 

3820 

3838 

3856 

3874 

3892 

3909 

3927 

3945 

3962 

2 

4 

5 

7 

9 

11 

12 

14 

16 

25 

3979 

3997 

4014 

4031 

4048 

4065 

4082 

4099 

4116 

4133 

2 

3 

5 

7 

9 

10 

12 

14 

15 

26 

4150 

4166 

4183 

4200 

4216 

4232 

4249 

4265 

4281 

4298 

2 

3 

5 

7 

8 

10 

11 

13 

15 

27 

4314 

4330 

4346 

4362 

4378 

4393 

4409 

4425 

4440 

4456 

2 

3 

5 

6 

8 

9 

11 

13 

14 

28 

4472 

4487 

4502 

4518 

4533 

4548 

4564 

4579 

4594 

4609 

2 

3 

5 

6 

8 

9 

11 

12 

14 

29 

4624 

4639 

4654 

4669 

4683 

4698 

4713 

4728 

4742 

4757 

1 

3 

4 

6 

7 

9 

10 

12 

13 

30 

4771 

4786 

4800 

4814 

4829 

4843 

4857 

4871 

4886 

4900 

1 

3 

4 

6 

7 

9 

10 

11 

13 

31 

4914 

4928 

4942 

4955 

4969 

4983 

4997 

5011 

5024 

5038 

1 

3 

4 

6 

7 

8 

10 

11 

12 

32 

5051 

5065 

5079 

5092 

5105 

5119 

5132 

5145 

5159 

5172 

1 

3 

4 

5 

7 

8 

9 

11 

12 

33 

5185 

5198 

5211 

5224 

5237 

5250 

5263 

5276 

5289 

5302 

1 

3 

4 

5 

6 

8 

9 

10 

12 

34 

5315 

5328 

5340 

5353 

5366 

5378 

5391 

5403 

5416 

5428 

1 

3 

4 

5 

6 

8 

9 

10 

11 

35 

5441 

5453 

5465 

5478 

5490 

5502 

5514 

5527 

5539 

5551 

1 

2 

4 

5 

6 

7 

9 

10 

11 

36 

5563 

5575 

5587 

5599 

5611 

5623 

5635 

5647 

5658 

5670 

1 

2 

4 

5 

6 

7 

8 

10 

11 

37 

5682 

5694 

5705 

5717 

5729 

5740 

5752 

5763 

5775 

5786 

1 

2 

3 

5 

6 

7 

8 

9 

10 

38 

5798 

5809 

5821 

5832 

5843 

5855 

5866 

5877 

5888 

5899 

1 

2 

3 

5 

6 

7 

8 

9 

10 

39 

5911 

5922 

5933 

5944 

5955 

5966 

5977 

5988 

5999 

6010 

1 

2 

3 

4 

5 

7 

8 

9 

10 

40 

6021 

6031 

6042 

6053 

6064 

6075 

6085 

6096 

6107 

6117 

1 

2 

3 

4 

5 

6 

8 

9 

10 

41 

6128 

6138 

6149 

6160 

6170 

6180 

6191 

6201 

6212 

6222 

1 

2 

3 

4 

5 

6 

7 

8 

9 

42 

6232 

6243 

6253 

6263 

6274 

6284 

6294 

6304 

6314 

6325 

1 

2 

3 

4 

5 

6 

7 

8 

9 

43 

6335 

6345 

6355 

6365 

6375 

6385 

6395 

6405 

6415 

6425 

1 

2 

3 

4 

5 

6 

7 

8 

9 

44 

6435 

6444 

6454 

6464 

6474 

6484 

6493 

6503 

6513 

6522 

1 

2 

3 

4 

5 

6 

7 

8 

9 

45 

6532 

6542 

6551 

6561 

6571 

6580 

6590 

6599 

6609 

6618 

1 

2 

3 

4 

5 

6 

7 

8 

9 

46 

6628 

6637 

6646 

6656 

6665 

6675 

6684 

6693 

6702 

6712 

1 

2 

3 

4 

5 

6 

7 

7 

8 

47 

6721 

6730 

6739 

6749 

6758 

6767 

6776 

6785 

6794 

6803 

1 

2 

3 

4 

5 

5 

6 

7 

8 

48 

6812 

6821 

6830 

6839 

6848 

6857 

6866 

6875 

6884 

6893 

1 

2 

3 

4 

4 

5 

6 

7 

8 

49 

6902 

6911 

6920 

6928 

6937 

6946 

6955 

6964 

6972 

6981 

1 

2 

3 

4 

4 

5 

6 

7 

8 

50 

6990 

6998 

7007 

7016 

7024 

7033 

7042 

7050 

7059 

7067 

1 

2 

3 

3 

4 

5 

6 

7 

8 

51 

7076 

7084 

7093 

7101 

7110 

7118 

7126 

7135 

7143 

7152 

1 

2 

3 

3 

4 

5 

6 

7 

8 

52 

7160 

7168 

7177 

7185 

7193 

7202 

7210 

7218 

7226 

7235 

1 

2 

2 

3 

4 

5 

6 

7 

7 

53 

7243 

7251 

7259 

7267 

7275 

7284 

7292 

7300 

7308 

7316 

1 

2 

2 

3 

4 

5 

6 

6 

7 

54 

7324 

7332 

7340 

7348 

7356 

7364 

7372 

7380 

7388 

7396 

1 

2 

2 

3 

4 

5 

6 

6 

7 

N 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

1 

2 

3 

4 

5 

6 

7 

8 

9 


567 









Logaritmos comunes con cuatro cifras decimales (continuación) 


N 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

1 

2 

Partes proporcionales 

3 4 5 6 7 

8 

9 

55 

7404 

7412 

7419 

7427 

7435 

7443 

7451 

7459 

7466 

7474 

1 

2 

2 

3 

4 

5 

5 

6 

7 

56 

7482 

7490 

7497 

7505 

7513 

7520 

7528 

7536 

7543 

7551 

1 

2 

2 

3 

4 

5 

5 

6 

7 

57 

7559 

7566 

7574 

7582 

7589 

7597 

7604 

7612 

7619 

7627 

1 

2 

2 

3 

4 

5 

5 

6 

7 

58 

7634 

7642 

7649 

7657 

7664 

7672 

7679 

7686 

7694 

7701 

1 

1 

2 

3 

4 

4 

5 

6 

7 

59 

7709 

7716 

7723 

7731 

7738 

7745 

7752 

7760 

7767 

7774 

1 

1 

2 

3 

4 

4 

5 

6 

7 

60 

7782 

7789 

7796 

7803 

7810 

7818 

7825 

7832 

7839 

7846 

1 

1 

2 

3 

4 

4 

5 

6 

6 

61 

7853 

7860 

7868 

7875 

7882 

7889 

7896 

7903 

7910 

7917 

1 

1 

2 

3 

4 

4 

5 

6 

6 

62 

7924 

7931 

7938 

7945 

7952 

7959 

7966 

7973 

7980 

7987 

1 

1 

2 

3 

3 

4 

5 

6 

6 

63 

7993 

8000 

8007 

8014 

8021 

8028 

8035 

8041 

8048 

8055 

1 

1 

2 

3 

3 

4 

5 

5 

6 

64 

8062 

8069 

8075 

8082 

8089 

8096 

8102 

8109 

8116 

8122 

1 

1 

2 

3 

3 

4 

5 

5 

6 

65 

8129 

8136 

8142 

8149 

8156 

8162 

8169 

8176 

8182 

8189 

1 

1 

2 

3 

3 

4 

5 

5 

6 

66 

8195 

8202 

8209 

8215 

8222 

8228 

8235 

8241 

8248 

8254 

1 

1 

2 

3 

3 

4 

5 

5 

6 

67 

8261 

8267 

8274 

8280 

8287 

8293 

8299 

8306 

8312 

8319 

1 

1 

2 

3 

3 

4 

5 

5 

6 

68 

8325 

8331 

8338 

8344 

8351 

8357 

8363 

8370 

8376 

8382 

1 

1 

2 

3 

3 

4 

4 

5 

6 

69 

8388 

8395 

8401 

8407 

8414 

8420 

8426 

8432 

8439 

8445 

1 

1 

2 

2 

3 

4 

4 

5 

6 

70 

8451 

8457 

8463 

8470 

8476 

8482 

8488 

8494 

8500 

8506 

1 

1 

2 

2 

3 

4 

4 

5 

6 

71 

8513 

8519 

8525 

8531 

8537 

8543 

8549 

8555 

8561 

8567 

1 

1 

2 

2 

3 

4 

4 

5 

5 

72 

8573 

8579 

8585 

8591 

8597 

8603 

8609 

8615 

8621 

8627 

1 

1 

2 

2 

3 

4 

4 

5 

5 

73 

8633 

8639 

8645 

8651 

8657 

8663 

8669 

8675 

8681 

8686 

1 

1 

2 

2 

3 

4 

4 

5 

5 

74 

8692 

8698 

8704 

8710 

8716 

8722 

8727 

8733 

8739 

8745 

1 

1 

2 

2 

3 

4 

4 

5 

5 

75 

8751 

8756 

8762 

8768 

8774 

8779 

8785 

8791 

8797 

8802 

1 

1 

2 

2 

3 

3 

4 

5 

5 

76 

8808 

8814 

8820 

8825 

8831 

8837 

8842 

8848 

8854 

8859 

1 

1 

2 

2 

3 

3 

4 

5 

5 

77 

8865 

8871 

8876 

8882 

8887 

8893 

8899 

8904 

8910 

8915 

1 

1 

2 

2 

3 

3 

4 

4 

5 

78 

8921 

8927 

8932 

8938 

8943 

8949 

8954 

8960 

8965 

8971 

1 

1 

2 

2 

3 

3 

4 

4 

5 

79 

8976 

8982 

8987 

8993 

8998 

9004 

9009 

9015 

9020 

9025 

1 

1 

2 

2 

3 

3 

4 

4 

5 

80 

9031 

9036 

9042 

9047 

9053 

9058 

9063 

9069 

9074 

9079 

1 

1 

2 

2 

3 

3 

4 

4 

5 

81 

9085 

9090 

9096 

9101 

9106 

9112 

9117 

9122 

9128 

9133 

1 

1 

2 

2 

3 

3 

4 

4 

5 

82 

9138 

9143 

9149 

9154 

9159 

9165 

9170 

9175 

9180 

9186 

1 

1 

2 

2 

3 

3 

4 

4 

5 

83 

9191 

9196 

9201 

9206 

9212 

9217 

9222 

9227 

9232 

9238 

1 

1 

2 

2 

3 

3 

4 

4 

5 

84 

9243 

9248 

9253 

9258 

9263 

9269 

9274 

9279 

9284 

9289 

1 

1 

2 

2 

3 

3 

4 

4 

5 

85 

9294 

9299 

9304 

9309 

9315 

9320 

9325 

9330 

9335 

9340 

1 

1 

2 

2 

3 

3 

4 

4 

5 

86 

9345 

9350 

9355 

9360 

9365 

9370 

9375 

9380 

9385 

9390 

1 

1 

2 

2 

3 

3 

4 

4 

5 

87 

9395 

9400 

9405 

9410 

9415 

9420 

9425 

9430 

9435 

9440 

0 

1 

1 

2 

2 

3 

3 

4 

4 

88 

9445 

9450 

9455 

9460 

9465 

9469 

9474 

9479 

9484 

9489 

0 

1 

1 

2 

2 

3 

3 

4 

4 

89 

9494 

9499 

9504 

9509 

9513 

9518 

9523 

9528 

9533 

9538 

0 

1 

1 

2 

2 

3 

3 

4 

4 

90 

9542 

9547 

9552 

9557 

9562 

9566 

9571 

9576 

9581 

9586 

0 

1 

1 

2 

2 

3 

3 

4 

4 

91 

9590 

9595 

9600 

9605 

9609 

9614 

9619 

9624 

9628 

9633 

0 

1 

1 

2 

2 

3 

3 

4 

4 

92 

9638 

9643 

9647 

9652 

9657 

9661 

9666 

9671 

9675 

9680 

0 

1 

1 

2 

2 

3 

3 

4 

4 

93 

9685 

9689 

9694 

9699 

9703 

9708 

9713 

9717 

9722 

9727 

0 

1 

1 

2 

2 

3 

3 

4 

4 

94 

9731 

9736 

9741 

9745 

9750 

9754 

9759 

9763 

9768 

9773 

0 

1 

1 

2 

2 

3 

3 

4 

4 

95 

9777 

9782 

9786 

9791 

9795 

9800 

9805 

9809 

9814 

9818 

0 

1 

1 

2 

2 

3 

3 

4 

4 

96 

9823 

9827 

9832 

9836 

9841 

9845 

9850 

9854 

9859 

9863 

0 

1 

1 

2 

2 

3 

3 

4 

4 

97 

9868 

9872 

9877 

9881 

9886 

9890 

9894 

9899 

9903 

9908 

0 

1 

1 

2 

2 

3 

3 

4 

4 

98 

9912 

9917 

9921 

9926 

9930 

9934 

9939 

9943 

9948 

9952 

0 

1 

1 

2 

2 

3 

3 

4 

4 

99 

9956 

9961 

9965 

9969 

9974 

9978 

9983 

9987 

9991 

9996 

0 

1 

1 

2 

2 

3 

3 

3 

4 

N 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

1 

2 

3 

4 

5 

6 

7 

8 

9 


568 








Apéndice VIII 


Valores de e A 

(0 < A < 1) 



(A= 1,2,3,. ..,10) 


10 


.36788 


.13534 


.04979 


.01832 


.006738 .002479 


.000912 


.000335 .000123 


.000045 


Nota: Para obtener valores dee A correspondientes a otros valores de A, úsense las leyes de los exponentes. 
Ejemplo: e~ 148 = (e- 300 )(e- 48 ) = (0.04 9 7 9)(0.6 1 88) = 0.0 3 081. 


569 










Apéndice IX 


Números aleatorios 


51772 

74640 

42331 

29044 

46621 

62898 

93582 

04186 

19640 

87056 

24033 

23491 

83587 

06568 

21960 

21387 

76105 

10863 

97453 

90581 

45939 

60173 

52078 

25424 

11645 

55870 

56974 
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en la distribución ji-cuadrada, 277 
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en la distribución normal, 173 
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distribución normal, 351 
población, 351 

tabla o distribución de frecuencia, 366 
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Carta-C, 490 

Carta de control de atributos, 481 
Categorías, 37 
Causas asignables, 480 
Causas comunes, 480 
Causas especiales, 480 
Centro de gravedad, 320 
Centroide, 320 
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Clase modal, 43 
Clasificación en un sentido, 403 
Clasificaciones de dos sentidos, 407 
Coeficiente cuartílico de asimetría, 125 
Coeficiente cuartílico de dispersión relativa, 116 
Coeficiente de asimetría de Pearson, 125 
Coeficiente de correlación, 348 
de tablas de contingencia, 298 
fórmula producto momento para, 350 
para datos agrupados, 350 
rectas de regresión y, 351 
teoría del muestreo y, 351 
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Coeficiente momento de curtosis, 125 
Coeficiente momento de sesgo, 125 
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Coeficientes de regresión parcial, 382 
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Comprobación de Charlier, 99 
para la media y la varianza, 99 
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Conjunto nulo, 146 
Constante, 1 

Conteos o enumeraciones, 2 
Contingencia, coeficiente de, 310 
Coordenadas, rectangulares, 4 
Corrección de Sheppard para momentos, 124 
Corrección de Sheppard para varianza, 100 
Corrección deYates para continuidad, 297 
Correlación, 345 
auto-, 351 

coeficiente de [ver Coeficiente de correlación) 

de atributos, 311 

espuria, 549 

lineal, 345 

medidas de, 346 

parcial, 385 

positiva y negativa, 345 
rango de, 450 
simple, 345 

Correlación espuria, 349 
Correlación múltiple, 382 
Correlación parcial, 382 
Correlación positiva, 346 
Correlación simple, 382 
Correlación sin sentido, 350 
Correlación tetracórica, 299 
Corridas, 449 

Cuadrado latino ortogonal, 413 
Cuadrados grecolatinos, 413 
Cuadrados latinos, 413 
ortogonales, 413 
Cuadrantes, 4 
Cuadrática: 
curva, 317 
ecuación, 35 
función, 17 
Cuantiles, 66 
Cuartiles, 66 
Curtosis, 125 

coeficiente momento de, 125 
coeficiente percentílico de, 125 
de una distribución binomial, 173 
de una distribución de Poisson, 176 
de una distribución normal, 125 
Curva cuártica, 317 
Curva cúbica, 317 
Curva de frecuencia bimodal, 41 
Curva de frecuencia multimodal, 41 
Curva de Gompertz, 318 
Curva de grado n, 317 
Curva exponencial, 318 
Curva geométrica, 318 
Curva logística, 318 
Curva normal, 173 
áreas bajo la, 173 
forma estándar de, 173 
ordenadas de, 187 


Curvas de frecuencia, 41 
relativa, 41 
tipos de, 41 

Curvas de frecuencia en forma de U, 41 
Curvas de frecuencia sesgadas, 41 
Curva simétrica o en forma de campana, 41 

D 

Datos: 

agrupados, 38 

dispersión o variación de, 89 
en bruto, 37 
Datos agrupados, 38 
Datos continuos, 1 
representación gráfica de, 57 
Datos de atributos, 481 
Datos discretos, 2 
representación gráfica de, 54 
Datos en bruto, 76 
Deciles, 66 

de datos agrupados, 87 
errores estándar para, 206 
Decisiones estadísticas, 245 
Defectos, 487 
Desigualdades, 5 

Desviación de la media aritmética, 63 
Desviación estándar, 96 
de datos agrupados, 98 
de distribuciones muéstrales, 204 
de una distribución de probabilidad, 155 
intervalo de confianza para, 230 
método abreviado de cálculo, 98 
método de codificación para, 96 
propiedades de, 98 
propiedad minimal de, 98 
relación con la desviación media, 100 
relación entre poblacional y muestral, 97 
Desviación media, 95 
de la distribución normal, 174 
para datos agrupados, 96 
Determinación: 
coeficiente de, 348 
múltiple, coeficiente de, 384 
Determinación múltiple, coeficiente de, 384 
Diagrama de Euler, 146 
Diagrama deVenn (ver Diagrama de Euler) 
Diagramas (ver Gráficas) 

Dígitos o cifras significativas, 3 
Diseño de experimentos, 412 
Diseño experimental, 412 
Dispersión, 87 (ver también Variación) 
absoluta, 95 
coeficiente de, 100 
medidas de, 95 
relativa, 100 
Dispersión absoluta, 100 
Dispersión del proceso, 282 
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Dispersión relativa o varianza, 95 
Distribución acumulada "o más", 40 
Distribución binomial, 172 
ajuste de datos, 195 
propiedades de, 172 
prueba de hipótesis usando, 250 
relación con la distribución de Poisson, 175 
relación con la distribución normal, 174 
Distribución ji-cuadrada, 297 (ver también J i-cuadrada) 
intervalos de confianza usando, 278 
pruebas de hipótesis y significancia, 294 
Distribución de Bernoulli (ver Distribución binomial) 
Distribución de Poisson, 175 
ajuste de datos mediante, 198 
propiedades de, 175 

relación con las distribuciones binomial y normal, 176 
Distribución en forma dej inversa, 41 
Distribuciones de frecuencia, 37 
acumulada, 40 
porcentual o relativa, 39 
reglas para la elaboración de, 38 
Distribuciones de probabilidad acumulada, 143 
Distribuciones de probabilidad continua, 143 
Distribuciones de probabilidad discreta, 142 
Distribuciones muéstrales, 204 
de diferencias y sumas, 205 
de diversos estadísticos, 204 
de medias, 204 
de proporciones, 205 
experimentales, 208 

Distribuciones unilaterales y bilaterales, 247 
Distribución F, 279 (ver también Análisis de varianza) 
Distribución multinomial, 177 
Distribución normal, 173 
forma estándar de, 174 
proporciones de, 174 

relación con la distribución binomial, 174 
relación con la distribución de Poisson, 176 
Distribución t, 275 
Distribución unimodal, 64 
Dominio de una variable, 1 


E 

Ecuaciones, 5 
cuadráticas, 35 

de curvas de aproximación, 317 
de regresión, 382 
equivalentes, 5 

miembros izquierdo y derecho de, 5 
simultáneas, 25, 34 
solución de, 5 
trasposición en, 26 
Ecuaciones normales: 
para el plano de mínimos cuadrados, 321 
para la parábola de mínimos cuadrados, 320 
para la recta de mínimos cuadrados, 320 
Ecuaciones simultáneas, 5 


Ejes X y 7 de un sistema de coordenadas rectangulares, 4 
Eje y, 4 

Empates en la prueba H de Kruskal-Wallis, 448 
en la prueba U de M ann-W hitney, 447 
Entrada de una tabla, 42 
Enumeraciones, 2 
Error de agrupación, 39 
Error estándar de estimación, 348 
modificado, 348 
Error probable, 230 
Errores: 

de agrupación, 39 
de redondeo, 2 
probables, 230 
Errores de redondeo, 2 
Errores de redondeo acumulados, 2 
Errores estándar de distribuciones muéstrales, 206 
Errores tipo I y tipo II, 246 
Espacio de cuatro dimensiones, 385 
Espacio muestral, 146 
Esperanza matemática, 144 
Estadística, 1 
deductiva o descriptiva, 1 
definición de, 1 
inductiva o inferencial, 1 
Estadística deductiva, 1 
Estadística descriptiva, 1 
Estadística inductiva o inferencial, 1 
Estadístico de prueba, 247 
Estadístico H, 448 
Estadístico muestral, 1 
Estadístico (7, 447 
Estadísticos muéstrales, 203 
Estimación, 227 

Estimaciones (ver también Estimación) 
eficientes e ineficientes, 228 
puntual y de intervalo, 228 
sesgadas y no sesgadas, 227 
Estimaciones insesgadas, 227 
Estimaciones por intervalo, 228 
Estimaciones y estimadores eficientes, 228 
Estimaciones y estimadores ineficientes, 228 
Estimación puntual, 228 
Estimación sesgada, 227 
Evento compuesto, 143 
Eventos, 140 
compuestos, 140 
dependientes, 140 
independientes, 140 
mutuamente excluy entes, 141 
Eventos dependientes, 140 
Eventos independientes, 140 
Eventos mutuamente excluyentes, 141 
Éxito, 139 

Expansión multinomial, 177 
Experimento de dos factores, 407 
Experimento de un factor, 403 
Exponente, 2 
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F 

Factores de ponderación, 62 
Factorial, 143 

Fórmula de Spearman para la correlación por rangos, 450 
Fórmula de Stirling para, 146 
Fórmula o expansión binomial, 173 
Fórmula para el Interés compuesto, 85 
Fórmula producto momento para el coeficiente de 
correlación, 350 
Fracaso, 139 

Frecuencia (ver también Frecuencia de clase) 
acumulada, 40 
modal, 41 
relativa, 40 

Frecuencia acumulada, 40 
Frecuencia de clase, 37 
Frecuencia relativa, 39 
curvas, 39 

definición de probabilidad, 139 
distribución, 39 
tabla, 39 

Frecuencias de celda, 496 
Frecuencias esperadas o teóricas, 181 
Frecuencias marginales, 294 
Frecuencias observadas, 294 
Frecuencias teóricas, 295 
Fronteras de clase, inferior y superior, 38 
Función, 4 
de distribución, 142 
de frecuencia, 142 
de probabilidad, 139 
lineal, 318 
multivaluada, 4 
univaluada, 4 
Función de densidad, 144 
Función de distribución, 142 
Función de frecuencia, 142 
Función de probabilidad, 142 
Funciones univaluadas, 4 

G 

Gosset, 276 

Grados de libertad, 276 
Gráfica, 5 
de barras, 18 
de pastel, 5 
Gráfica cero, 489 

Gráfica circular (ver Gráfica o carta de pastel) 

Gráfica Cusum, 490 

Gráfica de efectos principales, 429 

Gráfica de interacción, 429 

Gráfica de medianas, 489 

Gráfica de Pareto, 504 

Gráfica EWM A, 490 

Gráfica NP, 487 

Gráfica o carta de pastel, 5 

Gráfica-P, 487 

Gráfica 0,490 


Gráficas de control, 480 

Gráficas individuales, 489 

Gráficas o cartas de barras, parte componente, 4 

GráficasX barra y R, 481 

Gran media, 404 

H 

Hipérbola, 318 
Hiperplano, 385 
H ipótesis, 245 
alternativa, 245 
nula, 245 

H ipótesis alternativa, 245 
H ipótesis nula, 245 
H istogramas, 39 
cálculo de medianas para, 64 
de frecuencia porcentual o relativa, 39 
de probabilidad, 153 
Floja de conteo, 39 

I 

Identidad, 5 
índice CP, 485 
índice CPK, 485 

índice de capacidad del proceso, 485 
índice de capacidad inferior, 485 
índice de capacidad superior, 485 
Interacción, 411 
Interés compuesto, 85 
Interpolación, 7 
Intersección, 319 

Intersección con el ejeX, 283, 289-291 
Intersección de conjuntos, 146 
Intervalo de confianza: 
en correlación y regresión, 374 
para desviaciones estándar, 230 
para diferencias y sumas, 230 
para medias, 229 
para proporciones, 229 
usando la distribución ji-cuadrada, 278 
usando la distribución normal, 229-230 
usando la distribución t, 276 
Intervalos de clase, 38 
abierto, 38 

amplitud o tamaño de, 38 
desiguales, 51 
mediano, 64 
modal, 43 


Ji-cuadrada, 294 
correlación de Y ates para, 297 
definición de, 294 

fórmulas para, en tablas de contingencia, 297 
para bondad de ajuste, 295 
propiedad aditiva de, 299 
prueba, 295 
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L 

Leptocúrtica, 125 
Límite inferior de control, 480 
L imite inferior de especificación, 484 
Límite superior de control, 480 
L imite superior de especificación, 484 
Límites de clase, 38 
inferior y superior, 38 
verdaderos, 38 
Límites de confianza, 229 
Límites de control, 480 
L imites de especificación, 484 
Línea central, 480 
Línea recta, 317 
ecuación de, 317 
mínimos cuadrados, 318 
pendiente de, 318 
regresión, 321 
Logaritmos, 6 
base de, 6 
cálculos usando, 7 
comunes, 6 
naturales, 6 

Logaritmos comunes, 6 
Logaritmos naturales, base de, 6 
Longitud, tamaño o amplitud de clase, 38 

M 

Marca de clase, 38 
M edia aritmética, 61 
calculada a partir de datos agrupados, 63 
comprobación de Charlier para, 99 
de medias aritméticas, 63 
de una población y de una muestra, 144 
distribuciones de probabilidad, 142 
efecto de valores extremos (o atípicos) en, 71 
método de codificación para calcularla, 63 
método largo y método abreviado para calcularla, 63 
ponderada, 62 
propiedades de la, 63 
relación con la mediana y la moda, 64 
relación con las medias geométrica y armónica, 66 
supuesta o adivinada, 63 
M edia armónica, 65 
ponderada, 86 

relación con las medias aritmética y geométrica, 66 
M edia del grupo, 404 
M edia geométrica, 65 
de datos agrupados, 83 
idoneidad para promedios de cocientes, 84 
ponderada, 84 

relación con las medias aritmética y armónica, 66 
M ediana, 64 

calculada a partir de un histograma o de una ojiva 
porcentual, 64 
de datos agrupados, 64 
efecto de valores atípicos sobre la, 78 
relación con la media aritmética y con la moda, 64 


M edias de renglón, 403 
M edias de tratamiento, 345 
M ediciones, 2 

M edidas de tendencia central, 61 
M ejor estimación, 228 
M esocúrtica, 125 

M étodo a mano para el ajuste de curvas, 318 
M étodo de conteo en la prueba J de M ann-W hitney, 447 
M étodos de codificación, 63 
para el coeficiente de correlación, 350 
para el momento, 124 
para la desviación estándar, 98 
para la media, 63 
M ínimos cuadrados: 
curva, 319 
parábola, 320 
plano, 321 
recta, 319 
M oda, 64 

de datos agrupados, 64 
fórmulas para, 64 

relación con la media y la mediana, 65 
M odelo o distribución teórica, 177 
M omentos, 123 
adimensionales, 124 
correcciones de Sheppard para, 124 
definición de, 123 

método de codificación para el cálculo de, 124 
para datos agrupados, 123 
relaciones entre, 124 

verificación de Charlier para el cálculo de, 124 
M omentos adimensionales, 124 
M uestra, 1 
M uestreo: 
con reemplazo, 204 
sin reemplazo, 204 

N 

Nivel de significancia, 246 
N iveles de confianza, tablas de, 229 
No aleatoria, 449 
No lineal: 

correlación y regresión, 346 
ecuaciones, reducibles a forma lineal, 320 
regresión múltiple, 382 
relación entre variables, 316 
Notación científica, 2 
Número muestral, 213 

O 

Ojivas, 40 

deciles, percentiles y cuartiles obtenidos de, 87 

mediana obtenida de, 78 

"menos de", 52 

"o más", 52 

porcentual, 53 

suavizada, 53 
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Ordenaciones, 37 
Ordenadas, 4 
Origen, 5 

P 

Papel para gráficas 
de probabi lístico, 177 
log-log, 339 
semilogarítmico, 318 
Papel semllog, 318 
Parábola, 320 

Parámetros, estimación de, 227 

Parámetros poblacionales, 228 

Partes por millón (ppm), 484 

Patrón cíclico en pruebas de corridas, 449 

Pendiente de una recta, 318 

Percentiles, 66 

Permutaciones, 145 

Plano, 4 

PlanoXy, 4 

Platlcúrtica, 125 

Población, 1 

Polígonos de frecuencia, 39 
porcentuales o relativos, 39 
suavizados, 41 
Polinomios, 318 
Ponderada: 
media aritmética, 62 
media armónica, 85 
media geométrica, 83 
Porcentual: 
distribución, 39 
distribuciones acumuladas, 39 
frecuencia acumulada, 39 
histograma, 38 
ojivas, 39 
Probabilidad, 139 
análisis combinatorio y, 143 
axiomática, 140 
condicional, 140 
definición clásica de, 139 
definición de, mediante frecuencias relativas, 140 
distribuciones de, 142 
empírica, 140 

reglas fundamentales de, 146 
relación con la teoría de conjuntos, 146 
Probabilidad condicional, 140 
Probabilidad empírica, 139 
Progresión aritmética: 
momentos de, 136 
varianza de, 120 
Promedio, 62 

Proporción de no conformes, 484 
Proporciones, 205 
distribución muestral de, 205 
intervalo de confianza para, 229 
pruebas de hipótesis para, 245 


Prueba de bondad de ajuste, 177 (véase también Ajuste de 
datos) 

Prueba de dos lados o de dos colas, 247 

Prueba de homogeneidad de la varianza, 285 

Prueba de los signos, 446 

Prueba de normalidad, 196 

Prueba H de Kruskal-Wallls, 448 

Pruebas: 

de hipótesis y de significancia, 245 
en las que Interviene la distribución binomial, 250 
en las que Interviene la distribución normal, 246 
para causas especiales, 484 
para diferencias de medias y proporciones, 249 
para medias y proporciones, 249 
relacionadas con correlación y regresión, 352 
Pruebas no paramétricas, 446 
para correlación, 450 
prueba de corridas, 449 
prueba de los signos, 449 
prueba H de Kruskal-Wallis, 448 
prueba U de M ann-W hitney, 447 
Prueba U de M ann W hitney, 454 
Punto cero, 4 

Puntuaciones estándar, 101 
Puntuación o estadístico t, 275 

Q 

Quintiles, 87 

R 

Raíz cuadrada media, 66 
Rango, 95 
intercuartílico, 96 
percentil 10-90, 96 
semiintercuartílico, 96 
Rango, coeficiente de correlación por, 450 
Rango Intercuartílico, 96 
semi-, 96 

Rango percentil, 96 
Rango percentílico 10-90, 96 
Rango semi i ntercuartíl ico, 96 
Redondeo de datos, 2 
Región crítica, 247 

Región de aceptación, 247 (ver también Hipótesis) 

Reglas de decisión, 246 (ver también Decisiones 
estadísticas) 

Regresión, 321 
curva de, 321 
múltiple, 345 
plano, 321 
recta, 321 
simple, 343 
superficie, 322 
teoría muestral de, 352 

Relación empírica entre media, mediana y moda, 64 
Relación empírica entre medidas de dispersión, 100 
Residual, 319 
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S 

Sesgo, 41 

coeficiente cuartílico de, 125 
coeficiente de sesgo percentílico 10-90,125 
coeficientes de Pearson de, 125 
distribución binomial, 172 
distribución de Poisson, 175 
distribución normal, 173 
negativo, 41 

Signos de desigualdad, 5 
Solución de ecuaciones, 5 
Subgrupos, 418 
Subíndices, 61 
Sumatoria, 61 

T 

Tabla, 4 

Tabla de correlación, 350 
Tablas de contingencia, 296 
coeficiente de correlación de, 298 
fórmulas para j¡-cuadrada en, 298 
Tablas de frecuencia (ver también Distribuciones 
de frecuencia) 
acumulada, 40 
relativa, 40 

Teorema del límite central, 204 
Teorema o regla de Bayes, 170 
Teoría de las muestras pequeñas, 275 
Teoría del muestreo, 203 
de correlación, 351 
de regresión, 352 
muestras grandes, 207 
uso de, en estimación, 227 

uso de, en pruebas de hipótesis y de significancia, 245 
Teoría exacta del muestreo o teoría de las muestras pequeñas, 
181 

Tratamiento, 345 
Triángulo de Pascal, 180 

U 

U nidad de inspección, 489 
U nión de conjuntos, 146 


V 

Valor absoluto, 95 
Valores críticos, 248 

Valores críticos (o coeficientes de confianza), 228 
valor-p, 245 
Variable, 1 
continua, 1 
datos, 480 
dependiente, 4 
discreta, 1 

distribuida normalmente, 173 
dominio de, 1 
estandarizada, 101 
gráfica de control, 480 
independiente, 4 

relación entre, 316 (ver también Ajuste de curva; 

Correlación; Regresión) 

Variable continua, 1 
Variable dependiente, 4 
cambio de, en ecuaciones de regresión, 284 
Variable discreta, 1 
Variable estandarizada, 101 
Variable independiente, 4 
Variación, 95 (ver también Dispersión) 
coeficiente cuartílico de, 116 
coeficiente de, 100 
explicada y no explicada, 348 
residual, 408 
total, 348 

Variación explicada, 348 
Variación no explicada, 348 
Variación residual, 409 
Variación total, 348 

Varianza, 97 (ver también Desviación estándar) 
combinada o conjunta, 98 
comprobación deCharlier para, 99 
corrección de Sheppard para, 100 
de una distribución de probabilidad, 204 
muestral modificada, 227 
relación entre poblacional y muestral, 14 


